FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6156, 637 aa
1>>>pF1KB6156 637 - 637 aa - 637 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.9489+/-0.00171; mu= -4.0971+/- 0.103
mean_var=487.3308+/-99.417, 0's: 0 Z-trim(110.3): 147 B-trim: 92 in 1/52
Lambda= 0.058098
statistics sampled from 11368 (11508) to 11368 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.354), width: 16
Scan time: 4.110
The best scores are: opt bits E(32554)
CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 4177 365.5 1.3e-100
CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 2571 230.9 4.2e-60
CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 2258 204.6 3.3e-52
CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 2252 204.1 4.6e-52
CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 2188 198.7 1.8e-50
CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 2157 196.1 1.1e-49
CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 2092 190.7 4.7e-48
CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 2091 190.6 5e-48
CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 2085 190.1 7.1e-48
CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 1913 175.6 1.5e-43
CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1901 174.6 3e-43
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1886 173.4 7.3e-43
CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1811 167.1 5.5e-41
CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1789 165.2 2e-40
CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1750 162.0 1.9e-39
CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1712 158.8 1.7e-38
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1609 150.2 7.5e-36
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1566 146.5 8e-35
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1566 146.5 8.3e-35
CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1559 145.9 1.3e-34
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 1506 141.5 2.6e-33
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1373 130.3 6.1e-30
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1359 129.2 1.4e-29
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1344 127.9 3.2e-29
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1327 126.5 8.8e-29
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1320 125.9 1.3e-28
CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1231 118.3 2e-26
CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 1159 112.4 1.5e-24
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1107 108.1 3.4e-23
CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 1076 105.6 2.2e-22
CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1005 99.4 1.1e-20
CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 994 98.5 2e-20
CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 792 81.6 2.6e-15
CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 785 80.8 3e-15
CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 732 76.6 8.7e-14
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 695 73.4 7.1e-13
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 693 73.4 9.1e-13
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 685 72.6 1.3e-12
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 677 71.9 2e-12
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 673 71.6 2.7e-12
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 644 69.2 1.5e-11
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 618 67.4 1e-10
>>CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 (644 aa)
initn: 4078 init1: 3848 opt: 4177 Z-score: 1920.0 bits: 365.5 E(32554): 1.3e-100
Smith-Waterman score: 4177; 98.9% identity (98.9% similar) in 644 aa overlap (1-637:1-644)
10 20 30 40 50 60
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGGFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGGFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKSRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKSRE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB6 REQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNLRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 REQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNLRR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB6 RVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTKVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 RVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTKVD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB6 LQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQYED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQYED
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB6 IAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 IAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQIS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB6 NLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLEIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 NLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLEIA
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB6 TYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGGSYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGGSYG
490 500 510 520 530 540
550 560 570 580 590
pF1KB6 SGGGGGGGRGSYGSGG-------GSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSG
:::::::::::::::: :::::::::::::::::::::::::::::::::::::
CCDS88 SGGGGGGGRGSYGSGGSSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSG
550 560 570 580 590 600
600 610 620 630
pF1KB6 GRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
610 620 630 640
>>CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 (639 aa)
initn: 2142 init1: 2142 opt: 2571 Z-score: 1192.6 bits: 230.9 E(32554): 4.2e-60
Smith-Waterman score: 2586; 66.8% identity (84.7% similar) in 647 aa overlap (1-626:1-623)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGG-----FSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGS
:: :.: .: :.::: :::::: . . .::.::: . .: :::::.
CCDS88 MSCQISCKSRGRGGGGGGFRGFSSGSAVVSGGSRRSTSSFSC--------LSRHGGGGGG
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 FGAGGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGG--GGFGGGG-FGGG-GFGG
:: ::::::::::.:::.:::::::: ::: : : .::.:: ::::::. :::: ::.:
CCDS88 FG-GGGFGSRSLVGLGGTKSISISVA-GGGGGFGAAGGFGGRGGGFGGGSSFGGGSGFSG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 GGIGGGGFGGFGSGGGGFGG-GGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEID
::.::::::: : :: ::: :: :: : ::.:: ::::.::..::::::::::..:
CCDS88 GGFGGGGFGG-GRFGG-FGGPGGVGGLGGPGGFGPGGYPGGIHEVSVNQSLLQPLNVKVD
120 130 140 150 160
180 190 200 210 220 230
pF1KB6 PEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPY
::::.::..::::::.:::.:::::::::::::::::::::::::::....:: ::::
CCDS88 PEIQNVKAQEREQIKTLNNKFASFIDKVRFLEQQNQVLQTKWELLQQMNVGTRPINLEPI
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 FESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKD
:...:..:.: .: : .... .:::.::::.::::..:::::::::: :::.:::.:::
CCDS88 FQGYIDSLKRYLDGLTAERTSQNSELNNMQDLVEDYKKKYEDEINKRTAAENDFVTLKKD
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 VDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSI
::.::: ::.::.:.: :.:::.:: .::.::.::.. ....:::::::::.:.::::::
CCDS88 VDNAYMIKVELQSKVDLLNQEIEFLKVLYDAEISQIHQSVTDTNVILSMDNSRNLDLDSI
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 IAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRS
:::::::::.:::.:: :::.::.:::::::.:.::::::... ::::::::::::::..
CCDS88 IAEVKAQYEEIAQRSKEEAEALYHSKYEELQVTVGRHGDSLKEIKIEISELNRVIQRLQG
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB6 EIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMN
:: .:::: .:.:..:.:::::::.:::::.:::::::.:::::::::::::::::::::
CCDS88 EIAHVKKQCKNVQDAIADAEQRGEHALKDARNKLNDLEEALQQAKEDLARLLRDYQELMN
410 420 430 440 450 460
480 490 500 510 520
pF1KB6 TKLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTS--------HTTISGGGSRGGG-
.:::::.:::::: :::::: ::::. . ::.:::..: .....:.:.::..
CCDS88 VKLALDVEIATYRKLLEGEECRMSGDLSSNVTVSVTSSTISSNVASKAAFGGSGGRGSSS
470 480 490 500 510 520
530 540 550 560 570 580
pF1KB6 GGGYGSGGSSYGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYR
::::.::.::::::: . :: ::.::: :: :::: ::::::.::. :::: :: .
CCDS88 GGGYSSGSSSYGSGGRQSGSRGGSGGG-GSI-SGGG-YGSGGGSGGR--YGSG---GGSK
530 540 550 560 570 580
590 600 610 620 630
pF1KB6 GGS-GGGGGGSSGGR-GSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
::: .::: ::.::. .::::: ::: .: : .::: :::::::
CCDS88 GGSISGGGYGSGGGKHSSGGGSRGGSSSGGGYGSGG----GGSSSVKGSSGEAFGSSVTF
590 600 610 620 630
CCDS88 SFR
>>CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 (638 aa)
initn: 2274 init1: 1991 opt: 2258 Z-score: 1050.8 bits: 204.6 E(32554): 3.3e-52
Smith-Waterman score: 2327; 61.3% identity (80.1% similar) in 653 aa overlap (1-633:1-631)
10 20 30 40 50 60
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAGG
:.:: ..: . ::: : ..... . : : . ::::.:: ..:: .:. :
CCDS88 MNRQVCKKSFSGRSQGFS-GRSAVVSGSSRM--SCVARSGGAGG--GACGFRSGA----G
10 20 30 40 50
70 80 90 100 110
pF1KB6 GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGG---GFGG---GGFGGG-G
.:::::: :::..:::::::: :..:..::::: .. ::.:: :::: :::::: :
CCDS88 SFGSRSLYNLGSNKSISISVAAGSSRAGGFGGGRSSCGFAGGYGGGFGGSYGGGFGGGRG
60 70 80 90 100 110
120 130 140 150 160
pF1KB6 IGGG--GFGGFGSGGGGFGGGG-FGG-GGYGG--GYGPVCPPGGIQEVTINQSLLQPLNV
.:.: : :::: :.::::: : ::: :..:: :.:: ::::::: .::::::::::
CCDS88 VGSGFGGAGGFG-GAGGFGGPGVFGGPGSFGGPGGFGPGGFPGGIQEVIVNQSLLQPLNV
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB6 EIDPEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNL
::::.: .::..::::::.:::.:::::::::::::::.::.:::::::: :.. .:
CCDS88 EIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWELLQQQTTGSGPSSL
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB6 EPYFESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTI
:: :::.:. : ...:.: .... :..:::.:::.:::...:::::::::: :::::: .
CCDS88 EPCFESYISFLCKQLDSLLGERGNLEGELKSMQDLVEDFKKKYEDEINKRTAAENEFVGL
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB6 KKDVDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDL
:::::.:.:.::.::::.:.: .:..:: .::. ::::::.. :.:.:.::::::: :::
CCDS88 KKDVDAAFMNKVELQAKVDSLTDEVSFLRTLYEMELSQMQSHASDTSVVLSMDNNRCLDL
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB6 DSIIAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQR
::::::.::::.:::.::.:::.:::.: ::: :::::::..::.: :: ::::.:::
CCDS88 GSIIAEVRAQYEEIAQRSKSEAEALYQTKLGELQTTAGRHGDDLRNTKSEIMELNRMIQR
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB6 LRSEIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQE
::.::.::::: .::: .:..:::::: :::::. ::.::. :::.::.:::::::::::
CCDS88 LRAEIENVKKQNANLQTAIAEAEQRGEMALKDANAKLQDLQTALQKAKDDLARLLRDYQE
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB6 LMNTKLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISG--GGSRG--GGGG
:::.:::::.:::::: :::::: :::::: : .:: .. :. :: :.::: :: .
CCDS88 LMNVKLALDVEIATYRKLLEGEECRMSGECQSAVCISVVSNVTSTSGSSGSSRGVFGGVS
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB6 GYGSGGSSYGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGG
: :::: . ::...: .:: : .:: :: : :: : :: :: :. ::: :.:: :
CCDS88 GSGSGGYKGGSSSSS-SSGYGVSGGSGS-GYGGVSSGSTGGRGSSGSYQSSSS------G
540 550 560 570 580
590 600 610 620 630
pF1KB6 SGGGGGGSSGGRGSGGGSSGGSI---GGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
: ::.:: . :: :::.::: :: : .::: :::.:..: .:: :
CCDS88 SRLGGAGSISVSHSGMGSSSGSIQTSGGSGYKSGG----GGSTSIRFSQTTSSSQHSSTK
590 600 610 620 630
>>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa)
initn: 1596 init1: 1596 opt: 2252 Z-score: 1048.1 bits: 204.1 E(32554): 4.6e-52
Smith-Waterman score: 2363; 63.0% identity (79.6% similar) in 652 aa overlap (1-619:1-623)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGG--GFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGA
:::: :. :: :: ::: : ..... . : : . .:::.:: :. : ::
CCDS44 MSRQASKTSG---GGSQGFS-GRSAVVSGSSRM--SCVAHSGGAGG-----GAYGFRSGA
10 20 30 40
60 70 80 90 100
pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGG---------YGGG---GFGGG---G
:: :::::: ::::.:::::::: ::.:..::::: :::: :.::: :
CCDS44 GG-FGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGG
50 60 70 80 90 100
110 120 130 140 150
pF1KB6 FGGG-GFGGGGIGGGGFGGFGS--GGGGFGG-GGFGG-GGYGG--------GYGPVCPPG
:::: :.::: :.::::: :. :.::::: ::::: ::.:: :.:: ::
CCDS44 FGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPG
110 120 130 140 150 160
160 170 180 190 200 210
pF1KB6 GIQEVTINQSLLQPLNVEIDPEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQT
:::::::::::::::::::::.: .::..::::::.:::.:::::::::::::::.::.:
CCDS44 GIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLET
170 180 190 200 210 220
220 230 240 250 260
pF1KB6 KWELLQQVDTST--RTHNLEPYFESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRN
::.:::: ::. :.:::: ::. :: :: .:.. ....:::::::::.:.:::...
CCDS44 KWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKK
230 240 250 260 270 280
270 280 290 300 310 320
pF1KB6 KYEDEINKRTNAENEFVTIKKDVDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQT
:::::::::: :::::::.:::::.:::.::.::::.: : .::::: .::.:::::::.
CCDS44 KYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQS
290 300 310 320 330 340
330 340 350 360 370 380
pF1KB6 QISETNVILSMDNNRSLDLDSIIAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHG
.::.:.:.::::::::::::::::::.::::::::.::::::.:::.: ::: ::::::
CCDS44 HISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHG
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB6 DSVRNSKIEISELNRVIQRLRSEIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLE
:..::.: :: ::::.:::::.::..:::: .::: .:..:::.:: :::::. ::..:.
CCDS44 DDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQ
410 420 430 440 450 460
450 460 470 480 490 500
pF1KB6 DALQQAKEDLARLLRDYQELMNTKLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTS
::::::.::::::::::::::.:::::.:::::: :::::: :::::: ::.:: .:
CCDS44 AALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSS
470 480 490 500 510 520
510 520 530 540 550 560
pF1KB6 HTTISGGGSRGGGGGGYGSGGSSYGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGH
:: ..: :: ::::: :: . : ::: ...:::.:.: .: :::::
CCDS44 STT---SASAGGYGGGYG-GGMGGGLGGG-FSAGGGSGSG----------FGRGGGGGIG
530 540 550 560 570
570 580 590 600 610 620
pF1KB6 GSYGSGSSSGGYRGGSGGGG-GGSSGGRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKF
:..:.::: :. :::: :. .:. : ..:: ::... :: . : . .::
CCDS44 GGFGGGSS--GFSGGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
580 590 600 610 620
630
pF1KB6 VSTTYSGVTR
>>CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 (578 aa)
initn: 1955 init1: 1955 opt: 2188 Z-score: 1019.6 bits: 198.7 E(32554): 1.8e-50
Smith-Waterman score: 2280; 62.7% identity (83.3% similar) in 593 aa overlap (1-584:1-560)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSS-------CGGGG
::.::::.:. ::: : .: ..::. ::::. .: :::::
CCDS88 MSHQFSSQSA------FSSMS------RRVYSTSSSAGSGGGSPAVGSVCYARGRCGGGG
10 20 30 40
60 70 80 90 100 110
pF1KB6 GSFGAGG-GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGG
.: : ::::::: :::::.::::.. : ::: : : :::: :: ::: :
CCDS88 --YGIHGRGFGSRSLYNLGGSRSISINLM--GRSTSGFCQGGGVGGFG----GGRGFGVG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB6 GIGGGGFGGFGSGGGGFGGGGFGGGGYG-GGYGPVCPPGGIQEVTINQSLLQPLNVEIDP
. :.::::: :::::.::: ...: ::.:: ::::::::::::::::.::..:.::
CCDS88 STGAGGFGG-----GGFGGAGFGTSNFGLGGFGPYCPPGGIQEVTINQSLLEPLHLEVDP
110 120 130 140 150
180 190 200 210 220 230
pF1KB6 EIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYF
:::..:..::::: :::.::::::::::::::::::::::::::::.::: :.:::: .
CCDS88 EIQRIKTQEREQIMVLNNKFASFIDKVRFLEQQNQVLQTKWELLQQVNTSTGTNNLEPLL
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB6 ESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDV
:..:..:::.:: :...: : ..:...:::.::::..::::::::::..::.::..::::
CCDS88 ENYIGDLRRQVDLLSAEQMRQNAEVRSMQDVVEDYKSKYEDEINKRTGSENDFVVLKKDV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB6 DGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSII
:.::..::::....:.: :..:: :. .::::.::.::.:::::::::::::::::::
CCDS88 DAAYVSKVDLESRVDTLTGEVNFLKYLFLTELSQVQTHISDTNVILSMDNNRSLDLDSII
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB6 AEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSE
:..::: :::.:: :::.:::.::.:::::::::::...:::.::.::::..:::..:
CCDS88 DAVRTQYELIAQRSKDEAEALYQTKYQELQITAGRHGDDLKNSKMEIAELNRTVQRLQAE
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB6 IDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNT
:.:::::: ..:. :::::.:::.::.:: .::.:::.::::.::.::::::::: ....
CCDS88 ISNVKKQIEQMQSLISDAEERGEQALQDAWQKLQDLEEALQQSKEELARLLRDYQAMLGV
400 410 420 430 440 450
480 490 500 510 520 530
pF1KB6 KLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSS
::.::.:::::: :::::::::::: .::.::..:.....::. ::::.::::: .
CCDS88 KLSLDVEIATYRQLLEGEESRMSGELQSHVSISVQNSQVSVNGGA---GGGGSYGSGGYG
460 470 480 490 500 510
540 550 560 570 580 590
pF1KB6 YGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGS
::::: ::.: . :: :. : .::.:::: :::: ::::... :: ::.:
CCDS88 GGSGGG-YGGGRSYRGG-GARGRSGGGYGSGCGGGG-GSYGGSGRSG--RGSSRVQIIQT
520 530 540 550 560
600 610 620 630
pF1KB6 SGGRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
CCDS88 STNTSHRRILE
570
>>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa)
initn: 1998 init1: 1998 opt: 2157 Z-score: 1005.4 bits: 196.1 E(32554): 1.1e-49
Smith-Waterman score: 2312; 62.3% identity (80.8% similar) in 636 aa overlap (1-633:1-583)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGG--FSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGA
:::: :: : .::::. ::..:: . .: . .: .: .::::: :. . .: . :.
CCDS88 MSRQ-SSVS-FRSGGSRSFSTASAITPSVSRTSFTSVSRSGGGGGGGFGRVSLAG-ACGV
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGG-GFGGGGFGGGGFGGGGIGGG
:: .::::: :::::: ::::.. ::. . ::.: ::: :::::. :.::: :: .::
CCDS88 GG-YGSRSLYNLGGSKRISISTS-GGSFRNRFGAGAGGGYGFGGGA--GSGFGFGGGAGG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 GFGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVK
::: .: ::.::::: ::: :. ::::::::::::.::::: :::..::: ::.:.
CCDS88 GFG-LG-GGAGFGGG-FGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPSIQRVR
120 130 140 150 160
180 190 200 210 220 230
pF1KB6 SREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINN
..::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..:::
CCDS88 TEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQYINN
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 LRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMT
:::..:.. ....::::::.::::.:::..:::::::::::.:::::: .:::::.:::.
CCDS88 LRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEINKRTTAENEFVMLKKDVDAAYMN
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 KVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQ
::.:.::.: :..::.:. ...::::::::..:.:.:.:::::::.:::::::::::::
CCDS88 KVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVKAQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 YEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKK
::.::..:..:::: ::.:::::: :::::::..::.: ::::.::.:::::.:::::::
CCDS88 YEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNTKHEISEMNRMIQRLRAEIDNVKK
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB6 QISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDL
: .:::..:.::::::: :::::.::: .::.:::.::.:.:::::.::::::::::::.
CCDS88 QCANLQNAIADAEQRGELALKDARNKLAELEEALQKAKQDMARLLREYQELMNTKLALDV
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB6 EIATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGG
:::::: :::::: :.::: . :..:: :: ..:.:
CCDS88 EIATYRKLLEGEECRLSGEGVGPVNISVVTS--SVSSG----------------------
470 480 490 500
540 550 560 570 580 590
pF1KB6 SYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGGRGS
::::.: ::: : :. ::. :.: .::. ::: :.:: :: : ::: : : ::
CCDS88 -YGSGSGYGGGLG--GGLGGGLGGGLAGGSSGSYYSSSS-----GGVGLGGGLSVG--GS
510 520 530 540 550
600 610 620 630
pF1KB6 GGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
: ..:.: : : .::: :.:::::::::: :
CCDS88 GFSASSGRGLGVGFGSGG----GSSSSVKFVSTTSSSRKSFKS
560 570 580 590
>>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa)
initn: 1946 init1: 1946 opt: 2092 Z-score: 976.2 bits: 190.7 E(32554): 4.7e-48
Smith-Waterman score: 2200; 64.0% identity (82.4% similar) in 581 aa overlap (2-577:3-557)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSS-STRRSGGGGGRFSSCGGGGGSFGA
: . . :: : :::..:: . . .: :: :. :: :.:: ..:::.:
CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAG-----
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGG
:::::: .::::: ::: ::: . ...::::. . :. ::::.: .: :.:::.
CCDS88 ---FGSRSLYGLGGSKRISI----GGG-SCAISGGYGSRAGGSYGFGGAG-SGFGFGGGA
60 70 80 90 100
120 130 140 150 160 170
pF1KB6 FGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKS
::: :::. .::::: :. ::::::::::::.::::: :::..::: ::.:..
CCDS88 GIGFGLGGGAGLAGGFGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRA
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB6 REREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNL
.::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..::::
CCDS88 EEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQYINNL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 RRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTK
::..:.. ....::::::.::::.::: .::::::::::: :::::::.:::::.:::.:
CCDS88 RRQLDNIVGERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 VDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQY
:.:::: :.: .::.:: :::.::::::::.::.:.:.:::::::.::::::::::::::
CCDS88 VELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQY
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 EDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQ
:.:::.:.::::: ::.::::::::::::::..::.: ::.:.::.:::::::::.::::
CCDS88 EEIAQRSRAEAESWYQTKYEELQITAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQ
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB6 ISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLE
.::: .:.::::::: :::::::::. ::::::.::.::::::..::::::.:::::.:
CCDS88 CANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVE
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB6 IATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYG-SGGSSYGSGGG
::::: :::::: :..:: . .:..:: : :. :: :. .: :.: : .:::::
CCDS88 IATYRKLLEGEECRLNGEGVGQVNISVVQS-TVSSGYGGASGVGSGLGLGGGSSY-----
470 480 490 500 510
540 550 560 570 580 590
pF1KB6 SYGSGGGGGGGRGSYGSG---GGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGG
::::: : ::: .: .:: ::. .: :::.. .: . :::
CCDS88 SYGSGLGVGGGFSS-SSGRATGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
520 530 540 550 560
600 610 620 630
pF1KB6 RGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
>>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa)
initn: 1945 init1: 1945 opt: 2091 Z-score: 975.7 bits: 190.6 E(32554): 5e-48
Smith-Waterman score: 2199; 63.7% identity (82.6% similar) in 581 aa overlap (2-577:3-557)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSS-STRRSGGGGGRFSSCGGGGGSFGA
: . . :: : :::..:: . . .: :: :. :: :.:: ..:::.:
CCDS41 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSVSVSRSRGSGGLGGACGGAG-----
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGG
:::::: .::::: ::: ::: . ...::::. . :. ::::.: .: :.:::.
CCDS41 ---FGSRSLYGLGGSKRISI----GGG-SCAISGGYGSRAGGSYGFGGAG-SGFGFGGGA
60 70 80 90 100
120 130 140 150 160 170
pF1KB6 FGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKS
::: :::. .::::: :. ::::::::::::.::::: :::..::: ::.:..
CCDS41 GIGFGLGGGAGLAGGFGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPTIQRVRA
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB6 REREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNL
.::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..::::
CCDS41 EEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWTLLQEQGTKTVRQNLEPLFEQYINNL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 RRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTK
::..:.. ....::::::..:::.:::..::::::::::: :::::::.:::::.:::.:
CCDS41 RRQLDSIVGERGRLDSELRGMQDLVEDFKNKYEDEINKRTAAENEFVTLKKDVDAAYMNK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 VDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQY
:.:::: :.: .::.:: :::.::::::::.::.:.:.:::::::.::::::::::::::
CCDS41 VELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQY
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 EDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQ
:.:::.:.::::: ::.::::::.:::::::..::.: ::.:.::.:::::::::.::::
CCDS41 EEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQ
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB6 ISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLE
.::: .:.::::::: :::::::::. ::::::.::.::::::..::::::.:::::.:
CCDS41 CANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVE
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB6 IATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYG-SGGSSYGSGGG
::::: :::::: :..:: . .:..:: : :. :: :. .: :.: : .:::::
CCDS41 IATYRKLLEGEECRLNGEGVGQVNISVVQS-TVSSGYGGASGVGSGLGLGGGSSY-----
470 480 490 500 510
540 550 560 570 580 590
pF1KB6 SYGSGGGGGGGRGSYGSG---GGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGG
::::: : ::: .: .:: ::. .: :::.. .: . :::
CCDS41 SYGSGLGVGGGFSS-SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
520 530 540 550 560
600 610 620 630
pF1KB6 RGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
>>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa)
initn: 1939 init1: 1939 opt: 2085 Z-score: 973.0 bits: 190.1 E(32554): 7.1e-48
Smith-Waterman score: 2193; 63.9% identity (82.3% similar) in 581 aa overlap (2-577:3-557)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSS-STRRSGGGGGRFSSCGGGGGSFGA
: . . :: : :::..:: . . .: :: :. :: :.:: ..:::.:
CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAG-----
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGG
:::::: .::::: ::: ::: . ...::::. . :. ::::.: .: :.:::.
CCDS88 ---FGSRSLYGLGGSKRISI----GGG-SCAISGGYGSRAGGSYGFGGAG-SGFGFGGGA
60 70 80 90 100
120 130 140 150 160 170
pF1KB6 FGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKS
::: :::. .::::: :. ::::::::::::.::::: :::..::: ::.:..
CCDS88 GIGFGLGGGAGLAGGFGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRA
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB6 REREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNL
.::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..::::
CCDS88 EEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQYINNL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 RRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTK
::..:.. ....::::::.::::.::: .::::::::::: :::::::.:::::.:::.:
CCDS88 RRQLDSIVGERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 VDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQY
:.:::: :.: .::.:: :::.::::::::.::.:.:.:::::::.::::::::::::::
CCDS88 VELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQY
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 EDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQ
:.:::.:.::::: ::.::::::.:::::::..::.: ::.:.::.:::::::::.::::
CCDS88 EEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQ
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB6 ISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLE
..:: .:.::::::: :::::::::. ::::::.::.::::::..::::::.:::::.:
CCDS88 CASLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVE
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB6 IATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYG-SGGSSYGSGGG
::::: :::::: :..:: . .:.::: : : :: :. .: :.: : .:::::
CCDS88 IATYRKLLEGEECRLNGEGVGQVNVSVVQS-TISSGYGGASGVGSGLGLGGGSSY-----
470 480 490 500 510
540 550 560 570 580 590
pF1KB6 SYGSGGGGGGGRGSYGSG---GGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGG
::::: : ::: .: .:: ::. .: :::.. .: . :::
CCDS88 SYGSGLGIGGGFSS-SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
520 530 540 550 560
600 610 620 630
pF1KB6 RGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR
>>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa)
initn: 1940 init1: 1771 opt: 1913 Z-score: 895.5 bits: 175.6 E(32554): 1.5e-43
Smith-Waterman score: 2003; 60.9% identity (81.2% similar) in 558 aa overlap (1-558:2-507)
10 20 30 40 50
pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAG
..:: :.: : ::: ::: :.. .: . ::. :::.: : ::
CCDS41 MIARQQCVRGGPR---GFSCGSA-IVGGGKRGAFSSVSMSGGAG-RCSS-----------
10 20 30 40
60 70 80 90 100 110
pF1KB6 GGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGGF
:::::::: :: :.::::.::: :. .:. :: :.:::: :::::: :::. :
CCDS41 GGFGSRSLYNLRGNKSISMSVA-GSRQGACFG---GAGGFGTGGFGGG-FGGS------F
50 60 70 80 90
120 130 140 150 160 170
pF1KB6 GGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKSR
. :.:: :: :::: ::::::::::::: ::.::::::::::...
CCDS41 S--GKGGPGF---------------PVCPAGGIQEVTINQSLLTPLHVEIDPEIQKVRTE
100 110 120 130
180 190 200 210 220 230
pF1KB6 EREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNLR
:::::: :::.::::::::.::::::.::.:::.:::: :.: ..:::: ::.... ::
CCDS41 EREQIKLLNNKFASFIDKVQFLEQQNKVLETKWNLLQQQTTTTSSKNLEPLFETYLSVLR
140 150 160 170 180 190
240 250 260 270 280 290
pF1KB6 RRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTKV
...: : .:..::.::::.::: :::...:::.:::::: :::.::..:::::.::..::
CCDS41 KQLDTLGNDKGRLQSELKTMQDSVEDFKTKYEEEINKRTAAENDFVVLKKDVDAAYLNKV
200 210 220 230 240 250
300 310 320 330 340 350
pF1KB6 DLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQYE
.:.::.:.:..::.:: .::.::::::::..:.:.:.:::::::.::::::::::.::::
CCDS41 ELEAKVDSLNDEINFLKVLYDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVRAQYE
260 270 280 290 300 310
360 370 380 390 400 410
pF1KB6 DIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQI
.:::.::::::.:::.: ..:::.. .:::...:.: ::.::::.:::::.::.:.:::
CCDS41 EIAQRSKAEAEALYQTKVQQLQISVDQHGDNLKNTKSEIAELNRMIQRLRAEIENIKKQC
320 330 340 350 360 370
420 430 440 450 460 470
pF1KB6 SNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLEI
..:: :..:::::::::::::..: .:: :::::::.:::.::.:::::..:::::.::
CCDS41 QTLQVSVADAEQRGENALKDAHSKRVELEAALQQAKEELARMLREYQELMSVKLALDIEI
380 390 400 410 420 430
480 490 500 510 520 530
pF1KB6 ATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGGSY
:::: :::::: :::::: ::.:: .::. : :: .:: ::: :..: ..: .
CCDS41 ATYRKLLEGEEYRMSGECQSAVSISV------VSGSTSTGGISGGLGSG-SGFGLSSG-F
440 450 460 470 480
540 550 560 570 580 590
pF1KB6 GSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGGRGSGG
:::.:.: : :. ::..:
CCDS41 GSGSGSGFGFGGSVSGSSSSKIISTTTLNKRR
490 500 510 520
637 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 20:35:04 2016 done: Sun Nov 6 20:35:05 2016
Total Scan time: 4.110 Total Display time: 0.200
Function used was FASTA [36.3.4 Apr, 2011]