FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6743, 628 aa
1>>>pF1KE6743 628 - 628 aa - 628 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.4772+/-0.00156; mu= -2.5271+/- 0.094
mean_var=436.4560+/-85.969, 0's: 0 Z-trim(110.2): 150 B-trim: 0 in 0/54
Lambda= 0.061391
statistics sampled from 11307 (11444) to 11307 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.352), width: 16
Scan time: 3.530
The best scores are: opt bits E(32554)
CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 4128 380.8 3e-105
CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 2559 241.8 2.1e-63
CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 2280 217.1 5.4e-56
CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 2257 215.1 2.3e-55
CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 2257 215.1 2.4e-55
CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 2169 207.2 4.8e-53
CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 2167 207.0 5.4e-53
CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 2157 206.2 1e-52
CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 2034 195.2 1.8e-49
CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 1975 190.1 7.2e-48
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1931 186.1 1e-46
CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1886 182.1 1.6e-45
CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1820 176.3 9.4e-44
CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1818 176.1 1e-43
CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1745 169.6 9.3e-42
CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1723 167.7 3.5e-41
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1653 161.4 2.5e-39
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1653 161.5 2.6e-39
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 1615 158.1 2.5e-38
CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1534 150.9 3.9e-36
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1533 150.9 4.5e-36
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1389 138.1 2.8e-32
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1370 136.4 9e-32
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1351 134.7 2.8e-31
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1342 133.9 5.1e-31
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1341 133.8 5.2e-31
CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1244 125.1 1.8e-28
CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 1146 116.5 8e-26
CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1053 108.3 2.4e-23
CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 1051 108.1 2.6e-23
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1033 106.6 9.5e-23
CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 858 90.8 2.8e-18
CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 765 82.8 1.1e-15
CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 725 79.2 1.3e-14
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 725 79.2 1.3e-14
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 715 78.4 2.7e-14
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 700 77.0 5.9e-14
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 693 76.4 9.1e-14
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 692 76.3 9.8e-14
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 657 73.2 9e-13
CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 643 72.0 2.2e-12
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 631 71.3 6.6e-12
CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 595 67.7 4e-11
>>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa)
initn: 4128 init1: 4128 opt: 4128 Z-score: 2003.0 bits: 380.8 E(32554): 3e-105
Smith-Waterman score: 4128; 100.0% identity (100.0% similar) in 628 aa overlap (1-628:1-628)
10 20 30 40 50 60
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRSGAGGFGSRSLYNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSRQASKTSGGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRSGAGGFGSRSLYNL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 GGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGGFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGGFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 GAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQSLL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 QPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGTSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGTSS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 ISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRTAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 ENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLSMD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLSMD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 NNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEIIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEIIE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 LNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDLAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDLAR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE6 LLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGYGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGYGG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE6 GYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGARYGVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGARYGVS
550 560 570 580 590 600
610 620
pF1KE6 GGGFSSASNRGGSIKFSQSSQSSQRYSR
::::::::::::::::::::::::::::
CCDS44 GGGFSSASNRGGSIKFSQSSQSSQRYSR
610 620
>>CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 (638 aa)
initn: 2604 init1: 1692 opt: 2559 Z-score: 1251.9 bits: 241.8 E(32554): 2.1e-63
Smith-Waterman score: 3018; 74.3% identity (86.7% similar) in 654 aa overlap (1-627:1-636)
10 20 30 40 50
pF1KE6 MSRQASKTS-GGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRSGAGGFGSRSLYN
:.::. : : .: :::::::::::::::::::::.:::::::: :::::::.::::::::
CCDS88 MNRQVCKKSFSGRSQGFSGRSAVVSGSSRMSCVARSGGAGGGACGFRSGAGSFGSRSLYN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 LGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGGF
::.:::::::::::.:::::::::::::.::::::::: ::..:::::::::.:.::
CCDS88 LGSNKSISISVAAGSSRAGGFGGGRSSCGFAGGYGGGF----GGSYGGGFGGGRGVGSGF
70 80 90 100 110
120 130 140 150 160 170
pF1KE6 GGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQSL
:::::::::::::: : :::::.::: :::::::::::::::: .::::
CCDS88 GGAGGFGGAGGFGGPGVFGGPGSFGG------------PGGFGPGGFPGGIQEVIVNQSL
120 130 140 150 160
180 190 200 210 220 230
pF1KE6 LQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGTS
:::::::::::::::::::::::::::::::::::::::::::::::::::.::::: :.
CCDS88 LQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWELLQQQTTG
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE6 SISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRTA
:: ..::: ::..:..: . ::..::::: :..:::.:.:::::::::::::::::::
CCDS88 --SGPSSLEPCFESYISFLCKQLDSLLGERGNLEGELKSMQDLVEDFKKKYEDEINKRTA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE6 AENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLSM
:::::: ::::::.:.:::::::::::.: ::..::::::. :::::::: :::::::::
CCDS88 AENEFVGLKKDVDAAFMNKVELQAKVDSLTDEVSFLRTLYEMELSQMQSHASDTSVVLSM
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE6 DNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEII
:::: ::: :::::::::::.::::::.:::::::::::::::::::::::::::::::.
CCDS88 DNNRCLDLGSIIAEVRAQYEEIAQRSKSEAEALYQTKLGELQTTAGRHGDDLRNTKSEIM
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE6 ELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDLA
::::::::::::::.:::::::::::::::::.:::::::::::::.::.:::.::::::
CCDS88 ELNRMIQRLRAEIENVKKQNANLQTAIAEAEQRGEMALKDANAKLQDLQTALQKAKDDLA
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE6 RLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGYG
::::::::::::::::::::::::::::::: :::::: ::: :::::. :......: .
CCDS88 RLLRDYQELMNVKLALDVEIATYRKLLEGEECRMSGECQSAVCISVVSNVTSTSGSSGSS
470 480 490 500 510 520
540 550 560 570 580
pF1KE6 GGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGG-------------
: ::..:. .::...:..:.:. : : .:: :.:.:: ::: .::
CCDS88 RGVFGGVSGSGSGGYKGGSSSSSSSGYGVSGGSGSGYGGVSSGSTGGRGSSGSYQSSSSG
530 540 550 560 570 580
590 600 610 620
pF1KE6 -------------SGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
::.:: ::. .:.:..:... . ::.:::...:::. :
CCDS88 SRLGGAGSISVSHSGMGSSSGSIQTSGGSGYKSGGGGSTSIRFSQTTSSSQHSSTK
590 600 610 620 630
>>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa)
initn: 1535 init1: 1535 opt: 2280 Z-score: 1118.7 bits: 217.1 E(32554): 5.4e-56
Smith-Waterman score: 2423; 64.6% identity (82.1% similar) in 636 aa overlap (1-625:1-586)
10 20 30 40 50
pF1KE6 MSRQASKT-SGGGSQGFSGRSAVVSGSSRMS--CVAHSGGAGGGAYGFRS-----GAGGF
::::.: . .:::..:: ::.. . :: : :..:::.:::..: : :.::.
CCDS88 MSRQSSVSFRSGGSRSFSTASAITPSVSRTSFTSVSRSGGGGGGGFGRVSLAGACGVGGY
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 GSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGG
::::::::::.: ::::...:. : .: ::.: :::. :::::
CCDS88 GSRSLYNLGGSKRISISTSGGSFR------NR------------FGAGAGGGY--GFGGG
70 80 90 100
120 130 140 150 160 170
pF1KE6 RGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQE
: : :::: :..:::: .:: .::: ::::::: : ::::::
CCDS88 AGSGFGFGG----GAGGGFG----LGGGAGFG--GGFGGPGFPVCP--------PGGIQE
110 120 130 140
180 190 200 210 220 230
pF1KE6 VTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNL
::.::::: :::..:::.: .:...:::::::::::::::::::::::::::::.:::.:
CCDS88 VTVNQSLLTPLNLQIDPSIQRVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTL
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE6 LQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYED
::.:::... .:::::::..:: :: ::.:.::::::::::.::.:::::::.::::
CCDS88 LQEQGTKTV--RQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYED
210 220 230 240 250 260
300 310 320 330 340 350
pF1KE6 EINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISD
::::::.:::::: ::::::.::::::::.::::::.:::.:.. ..::::::::.:.::
CCDS88 EINKRTTAENEFVMLKKDVDAAYMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSD
270 280 290 300 310 320
360 370 380 390 400 410
pF1KE6 TSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLR
:::::::::::.::::::::::.::::.::.::..:::. :::: ::: ::::::::::
CCDS88 TSVVLSMDNNRNLDLDSIIAEVKAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLR
330 340 350 360 370 380
420 430 440 450 460 470
pF1KE6 NTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQ
::: :: :.:::::::::::..:::: ::::.:::.:::.::.::::: :: ::. :::
CCDS88 NTKHEISEMNRMIQRLRAEIDNVKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQ
390 400 410 420 430 440
480 490 500 510 520 530
pF1KE6 QAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTS
.::.:.:::::.::::::.::::::::::::::::::: :.::: . :.::::.::..:
CCDS88 KAKQDMARLLREYQELMNTKLALDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSS
450 460 470 480 490 500
540 550 560 570 580
pF1KE6 A--SAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGG-GIGGGFGGGSSGFSGGSGF
. :..::::: :::.:::::::. :::.::: .. ..:: :.:::.. :.::::..::
CCDS88 GYGSGSGYGGGLGGGLGGGLGGGL-AGGSSGSYYSSSSGGVGLGGGLSVGGSGFSASSGR
510 520 530 540 550
590 600 610 620
pF1KE6 GSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
: :. .: :::: :: :.:: ....::..
CCDS88 G--LGVGFG-SGGGSSS------SVKFVSTTSSSRKSFKS
560 570 580 590
>>CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 (639 aa)
initn: 2070 init1: 1442 opt: 2257 Z-score: 1107.3 bits: 215.1 E(32554): 2.3e-55
Smith-Waterman score: 2379; 64.8% identity (80.3% similar) in 631 aa overlap (10-613:16-606)
10 20 30 40
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR-----MSCVAHSGGAGGGAYGFRSGA
::: .:::. ::::::.:: .::... ::.::: : :.
CCDS88 MSCQISCKSRGRGGGGGGFRGFSSGSAVVSGGSRRSTSSFSCLSRHGGGGGG---F--GG
10 20 30 40 50
50 60 70 80 90 100
pF1KE6 GGFGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGG-
:::::::: .:::.::::::::.:: ::::. :::.:: :::::::
CCDS88 GGFGSRSLVGLGGTKSISISVAGGG---GGFGA-------AGGFGG-----RGGGFGGGS
60 70 80 90 100
110 120 130 140 150 160
pF1KE6 -FGGGRGM-GGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGF
:::: :. :::::: ::::: : ::: :::::: :: :: ::::::::.
CCDS88 SFGGGSGFSGGGFGG-GGFGG-GRFGG---FGGPGGVGGLGG---------PGGFGPGGY
110 120 130 140
170 180 190 200 210 220
pF1KE6 PGGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVL
::::.::..::::::::::..::.: .::::::::::::::::::::::::::::::.::
CCDS88 PGGIHEVSVNQSLLQPLNVKVDPEIQNVKAQEREQIKTLNNKFASFIDKVRFLEQQNQVL
150 160 170 180 190 200
230 240 250 260 270 280
pF1KE6 ETKWNLLQQQ--GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVE
.:::.::::. :: : ::::.:...:. :. :::.. .:: .:::.::.::::
CCDS88 QTKWELLQQMNVGTRPI----NLEPIFQGYIDSLKRYLDGLTAERTSQNSELNNMQDLVE
210 220 230 240 250 260
290 300 310 320 330 340
pF1KE6 DFKKKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELS
:.::::::::::::::::.:::::::::.::: :::::.::: : .::.::..:::::.:
CCDS88 DYKKKYEDEINKRTAAENDFVTLKKDVDNAYMIKVELQSKVDLLNQEIEFLKVLYDAEIS
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE6 QMQSHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTA
:... ..::.:.:::::.:.::::::::::.::::.:::::: ::::::..: :::.:.
CCDS88 QIHQSVTDTNVILSMDNSRNLDLDSIIAEVKAQYEEIAQRSKEEAEALYHSKYEELQVTV
330 340 350 360 370 380
410 420 430 440 450 460
pF1KE6 GRHGDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKL
:::::.:.. : :: ::::.::::..:: :::: :.: :::.:::.:: ::::: ::
CCDS88 GRHGDSLKEIKIEISELNRVIQRLQGEIAHVKKQCKNVQDAIADAEQRGEHALKDARNKL
390 400 410 420 430 440
470 480 490 500 510 520
pF1KE6 QELQAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSIS
..:. ::::::.:::::::::::::::::::::::::::::::::: ::::. : :..:
CCDS88 NDLEEALQQAKEDLARLLRDYQELMNVKLALDVEIATYRKLLEGEECRMSGDLSSNVTVS
450 460 470 480 490 500
530 540 550 560 570
pF1KE6 VVSSSTTS--ASAGGYGGGYGGGMGGGLGGGFSAG------GG--SGSGFGRGGGGGI-G
:.::. .: :: ...::. :: :.. :::.:.: :: ::: : ::::.: :
CCDS88 VTSSTISSNVASKAAFGGS--GGRGSSSGGGYSSGSSSYGSGGRQSGSRGGSGGGGSISG
510 520 530 540 550 560
580 590 600 610 620
pF1KE6 GGFG-----GGSSGFSGGSGFGSISGARYGVSGGGFSSAS-NRGGSIKFSQSSQSSQRYS
::.: :: : .::: :::::. :: .:: ::.. .::::
CCDS88 GGYGSGGGSGGRYGSGGGSKGGSISGGGYGSGGGKHSSGGGSRGGSSSGGGYGSGGGGSS
570 580 590 600 610 620
pF1KE6 R
CCDS88 SVKGSSGEAFGSSVTFSFR
630
>>CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 (644 aa)
initn: 1563 init1: 1563 opt: 2257 Z-score: 1107.3 bits: 215.1 E(32554): 2.4e-55
Smith-Waterman score: 2366; 64.8% identity (81.5% similar) in 628 aa overlap (1-613:1-591)
10 20 30 40
pF1KE6 MSRQASKTSG---GGSQGFS-GRSAVVSGSSRM--SCVAHSGGAGG-----GAYGFRSGA
:::: :. :: :: ::: : ..... . : : . .:::.:: :. : ::
CCDS88 MSRQFSSRSGYRSGG--GFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGA
10 20 30 40 50
50 60 70 80 90 100
pF1KE6 GG-FGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGG
:: :::::: ::::.:::::::: ::.:..::::: :::: :.::: :
CCDS88 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGG---------YGGG---GFGGG---G
60 70 80 90 100
110 120 130 140 150 160
pF1KE6 FGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPG
:::: :.::: :.::::: :. :.::::: ::::: ::.:: :.:: ::
CCDS88 FGGG-GFGGGGIGGGGFGGFGS--GGGGFGG-GGFGG-GGYGG--------GYGPVCPPG
110 120 130 140 150
170 180 190 200 210 220
pF1KE6 GIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLET
:::::::::::::::::::::.: .::..::::::.:::.:::::::::::::::.::.:
CCDS88 GIQEVTINQSLLQPLNVEIDPEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQT
160 170 180 190 200 210
230 240 250 260 270 280
pF1KE6 KWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKK
::.:::: :: . :.:::: ::. :: :: .:.. ....:::::::::.:.:::...
CCDS88 KWELLQQVDTS--TRTHNLEPYFESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRN
220 230 240 250 260
290 300 310 320 330 340
pF1KE6 KYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQS
:::::::::: :::::::.:::::.:::.::.::::.: : .::::: .::.:::::::.
CCDS88 KYEDEINKRTNAENEFVTIKKDVDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQT
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE6 HISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHG
.::.:.:.::::::::::::::::::.::::::::.::::::.:::.: ::: ::::::
CCDS88 QISETNVILSMDNNRSLDLDSIIAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHG
330 340 350 360 370 380
410 420 430 440 450 460
pF1KE6 DDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQ
:..::.: :: ::::.:::::.::..:::: .::: .:..:::.:: :::::. ::..:.
CCDS88 DSVRNSKIEISELNRVIQRLRSEIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLE
390 400 410 420 430 440
470 480 490 500 510 520
pF1KE6 AALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSS
::::::.::::::::::::::.:::::.:::::: :::::: :::::: ::.:: :.
CCDS88 DALQQAKEDLARLLRDYQELMNTKLALDLEIATYRTLLEGEESRMSGECAPNVSVSV-ST
450 460 470 480 490 500
530 540 550 560 570 580
pF1KE6 STTSASAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIG-GGFG-GGSSGFSGG
: :. :.:: :: :::.:.: :.....:::: .: ::::: : :..: :::: :::
CCDS88 SHTTISGGGSRGGGGGGYGSG-GSSYGSGGGS---YGSGGGGGGGRGSYGSGGSSYGSGG
510 520 530 540 550 560
590 600 610 620
pF1KE6 SGFGSISGAR-YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
...:: .:. .: :.: ::.. ::::
CCDS88 GSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGGRGSGGGSSGGSIGGRGSSSGGV
570 580 590 600 610 620
>>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa)
initn: 2038 init1: 1559 opt: 2169 Z-score: 1065.8 bits: 207.2 E(32554): 4.8e-53
Smith-Waterman score: 2249; 64.0% identity (80.5% similar) in 606 aa overlap (7-610:9-560)
10 20 30 40 50
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRS
.. ... .:::. :: . : :: .: :. : . :.:. : :..::::::
CCDS41 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSVSVSRSRGSGGLGGACGGAGFGSRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 LYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMG
::.:::.: ::: ::: :::..:::: : ::..: :::. :
CCDS41 LYGLGGSKRISI------------GGG--SCAISGGYG----SRAGGSYG--FGGA---G
70 80 90
120 130 140 150 160 170
pF1KE6 GGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTIN
.:: ::::..:.: :: :: : .::::::: : ::::::::.:
CCDS41 SGF----GFGGGAGIG----FGLGGGAGLAGGFGGPGFPVCP--------PGGIQEVTVN
100 110 120 130 140
180 190 200 210 220 230
pF1KE6 QSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQ
:::: :::..::: : .:.:.:::::::::::::::::::::::::::::::::.:::.:
CCDS41 QSLLTPLNLQIDPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWTLLQEQ
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE6 GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINK
::... .:::::::..:: :: ::.:.::::::::::..:.:::::::.::::::::
CCDS41 GTKTV--RQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRGMQDLVEDFKNKYEDEINK
210 220 230 240 250
300 310 320 330 340 350
pF1KE6 RTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVV
::::::::::::::::.:::::::::::.:.: :::.:::.::::::::::.::::::::
CCDS41 RTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVV
260 270 280 290 300 310
360 370 380 390 400 410
pF1KE6 LSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKS
:::::::.::::::::::.::::.:::::.::::. :::: :::.:::::::::::::.
CCDS41 LSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQ
320 330 340 350 360 370
420 430 440 450 460 470
pF1KE6 EIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKD
:: :.::::::::.::. :::: ::::.:::.:::.::::::::. ::. :. :::.::.
CCDS41 EIAEINRMIQRLRSEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQ
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE6 DLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAG
::::::..:::::::::::::::::::::::::: :..:: . :.::::.:...:
CCDS41 DLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSS----
440 450 460 470 480 490
540 550 560 570 580 590
pF1KE6 GYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGAR
::::. : : : ::::: :... :.: :.::::.. ::: . :.:..:..:.
CCDS41 GYGGASGVGSGLGLGGG--------SSYSYGSGLGVGGGFSS-SSGRAIGGGLSSVGGGS
500 510 520 530 540
600 610 620
pF1KE6 YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
.. ::.: .
CCDS41 STIKYTTTSSSSRKSYKH
550 560
>>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa)
initn: 2033 init1: 1558 opt: 2167 Z-score: 1064.9 bits: 207.0 E(32554): 5.4e-53
Smith-Waterman score: 2251; 63.9% identity (80.4% similar) in 606 aa overlap (7-610:9-560)
10 20 30 40 50
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRS
.. ... .:::. :: . : :: .: .. : . :.:. : :..::::::
CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAGFGSRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 LYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMG
::.:::.: ::: ::: :::..:::: : ::..: :::. :
CCDS88 LYGLGGSKRISI------------GGG--SCAISGGYG----SRAGGSYG--FGGA---G
70 80 90
120 130 140 150 160 170
pF1KE6 GGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTIN
.:: ::::..:.: :: :: : .::::::: : ::::::::.:
CCDS88 SGF----GFGGGAGIG----FGLGGGAGLAGGFGGPGFPVCP--------PGGIQEVTVN
100 110 120 130 140
180 190 200 210 220 230
pF1KE6 QSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQ
:::: :::..::: : .:.:.:::::::::::::::::::::::::::::.:::.:::.:
CCDS88 QSLLTPLNLQIDPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE6 GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINK
::... .:::::::..:: :: ::::.::::::::::.::.:::::.:.::::::::
CCDS88 GTKTV--RQNLEPLFEQYINNLRRQLDNIVGERGRLDSELRNMQDLVEDLKNKYEDEINK
210 220 230 240 250
300 310 320 330 340 350
pF1KE6 RTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVV
::::::::::::::::.:::::::::::.:.: :::.:::.::::::::::.::::::::
CCDS88 RTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVV
260 270 280 290 300 310
360 370 380 390 400 410
pF1KE6 LSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKS
:::::::.::::::::::.::::.:::::.::::. :::: ::: :::::::::::::.
CCDS88 LSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQITAGRHGDDLRNTKQ
320 330 340 350 360 370
420 430 440 450 460 470
pF1KE6 EIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKD
:: :.::::::::.::. :::: ::::.:::.:::.::::::::. ::. :. :::.::.
CCDS88 EIAEINRMIQRLRSEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQ
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE6 DLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAG
::::::..:::::::::::::::::::::::::: :..:: . :.::::.:...:
CCDS88 DLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSS----
440 450 460 470 480 490
540 550 560 570 580 590
pF1KE6 GYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGAR
::::. : : : ::::: :... :.: :.::::.. ::: . :.:..:..:.
CCDS88 GYGGASGVGSGLGLGGG--------SSYSYGSGLGVGGGFSS-SSGRATGGGLSSVGGGS
500 510 520 530 540
600 610 620
pF1KE6 YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
.. ::.: .
CCDS88 STIKYTTTSSSSRKSYKH
550 560
>>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa)
initn: 2025 init1: 1550 opt: 2157 Z-score: 1060.1 bits: 206.2 E(32554): 1e-52
Smith-Waterman score: 2237; 63.5% identity (80.4% similar) in 606 aa overlap (7-610:9-560)
10 20 30 40 50
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRS
.. ... .:::. :: . : :: .: .. : . :.:. : :..::::::
CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAGFGSRS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 LYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMG
::.:::.: ::: ::: :::..:::: : ::..: :::. :
CCDS88 LYGLGGSKRISI------------GGG--SCAISGGYG----SRAGGSYG--FGGA---G
70 80 90
120 130 140 150 160 170
pF1KE6 GGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTIN
.:: ::::..:.: :: :: : .::::::: : ::::::::.:
CCDS88 SGF----GFGGGAGIG----FGLGGGAGLAGGFGGPGFPVCP--------PGGIQEVTVN
100 110 120 130 140
180 190 200 210 220 230
pF1KE6 QSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQ
:::: :::..::: : .:.:.:::::::::::::::::::::::::::::.:::.:::.:
CCDS88 QSLLTPLNLQIDPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE6 GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINK
::... .:::::::..:: :: ::.:.::::::::::.::.:::::.:.::::::::
CCDS88 GTKTV--RQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDLKNKYEDEINK
210 220 230 240 250
300 310 320 330 340 350
pF1KE6 RTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVV
::::::::::::::::.:::::::::::.:.: :::.:::.::::::::::.::::::::
CCDS88 RTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVV
260 270 280 290 300 310
360 370 380 390 400 410
pF1KE6 LSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKS
:::::::.::::::::::.::::.:::::.::::. :::: :::.:::::::::::::.
CCDS88 LSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQ
320 330 340 350 360 370
420 430 440 450 460 470
pF1KE6 EIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKD
:: :.::::::::.::. :::: :.::.:::.:::.::::::::. ::. :. :::.::.
CCDS88 EIAEINRMIQRLRSEIDHVKKQCASLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQ
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE6 DLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAG
::::::..:::::::::::::::::::::::::: :..:: . :..:::.:. .:
CCDS88 DLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNVSVVQSTISS----
440 450 460 470 480 490
540 550 560 570 580 590
pF1KE6 GYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGAR
::::. : : : ::::: :... :.: ::::::.. ::: . :.:..:..:.
CCDS88 GYGGASGVGSGLGLGGG--------SSYSYGSGLGIGGGFSS-SSGRAIGGGLSSVGGGS
500 510 520 530 540
600 610 620
pF1KE6 YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
.. ::.: .
CCDS88 STIKYTTTSSSSRKSYKH
550 560
>>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa)
initn: 1806 init1: 1400 opt: 2034 Z-score: 1001.6 bits: 195.2 E(32554): 1.8e-49
Smith-Waterman score: 2111; 65.5% identity (80.5% similar) in 560 aa overlap (11-568:10-500)
10 20 30 40 50
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRSLY
:: .::: ::.:.:..: .: :. ::::: : ..:::::::::
CCDS41 MIARQQCVRGGPRGFSCGSAIVGGGKRGAFSSVSMSGGAG------RCSSGGFGSRSLY
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 NLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGG
:: ::::::.::: ::: : .:
CCDS41 NLRGNKSISMSVA--GSRQG-------AC-------------------------------
60 70
120 130 140 150 160 170
pF1KE6 FGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQS
:::::::: .:::: :::: :.:.:. :::: :.: ::::::::::
CCDS41 FGGAGGFG-TGGFG--GGFG--GSFSGK---GGPGFPVCPAG--------GIQEVTINQS
80 90 100 110
180 190 200 210 220 230
pF1KE6 LLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGT
:: ::.:::::.: .:...:::::: ::::::::::::.::::::::::::::::::: :
CCDS41 LLTPLHVEIDPEIQKVRTEEREQIKLLNNKFASFIDKVQFLEQQNKVLETKWNLLQQQTT
120 130 140 150 160 170
240 250 260 270 280 290
pF1KE6 SSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRT
.. : .:::::::.... ::. ::.. ...:::.::::.:.: ::::: :::.::::::
CCDS41 TTSS--KNLEPLFETYLSVLRKQLDTLGNDKGRLQSELKTMQDSVEDFKTKYEEEINKRT
180 190 200 210 220 230
300 310 320 330 340 350
pF1KE6 AAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLS
::::.::.::::::.::.:::::.::::.: :::.::..::::::::::.:.::::::::
CCDS41 AAENDFVVLKKDVDAAYLNKVELEAKVDSLNDEINFLKVLYDAELSQMQTHVSDTSVVLS
240 250 260 270 280 290
360 370 380 390 400 410
pF1KE6 MDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEI
:::::.:::::::::::::::.::::::::::::::::. .:: .. .:::.:.::::::
CCDS41 MDNNRNLDLDSIIAEVRAQYEEIAQRSKAEAEALYQTKVQQLQISVDQHGDNLKNTKSEI
300 310 320 330 340 350
420 430 440 450 460 470
pF1KE6 IELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDL
::::::::::::::..::: .::...:.:::.:: :::::..: ::.:::::::..:
CCDS41 AELNRMIQRLRAEIENIKKQCQTLQVSVADAEQRGENALKDAHSKRVELEAALQQAKEEL
360 370 380 390 400 410
480 490 500 510 520 530
pF1KE6 ARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGY
::.::.:::::.::::::.:::::::::::::::::::: :::::::::.:: :.::
CCDS41 ARMLREYQELMSVKLALDIEIATYRKLLEGEEYRMSGECQSAVSISVVSGST---STGGI
420 430 440 450 460 470
540 550 560 570 580 590
pF1KE6 GGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGARYG
.:: :.: : ::..:: :.::::::: ::
CCDS41 SGGLGSGSGFGLSSGF--GSGSGSGFGFGGSVSGSSSSKIISTTTLNKRR
480 490 500 510 520
>>CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 (578 aa)
initn: 1934 init1: 1301 opt: 1975 Z-score: 972.8 bits: 190.1 E(32554): 7.2e-48
Smith-Waterman score: 2064; 60.4% identity (78.5% similar) in 596 aa overlap (1-591:14-559)
10 20 30 40
pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRS
:::.. .::.....: .: :: :: : :. : :::.::...
CCDS88 MSHQFSSQSAFSSMSRRVYSTSSSAGSG-GGSPAV--GSV---CYAR-GRCGGGGYGIHG
10 20 30 40 50
50 60 70 80 90 100
pF1KE6 GAGGFGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGG
::::::::::::..::::.. :::. .: ::: :
CCDS88 --RGFGSRSLYNLGGSRSISINLM-----------GRSTSGFC--QGGGVG---------
60 70 80
110 120 130 140 150 160
pF1KE6 GFGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFP
:::::::.: : ::::::: ::::::: :: :. :: ::::: :
CCDS88 GFGGGRGFGVGSTGAGGFGG-GGFGGAG-------FGTSN-FGL-------GGFGPYCPP
90 100 110 120 130
170 180 190 200 210 220
pF1KE6 GGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLE
:::::::::::::.::..:.::.: ..:.:::::: .:::::::::::::::::::.::.
CCDS88 GGIQEVTINQSLLEPLHLEVDPEIQRIKTQEREQIMVLNNKFASFIDKVRFLEQQNQVLQ
140 150 160 170 180 190
230 240 250 260 270 280
pF1KE6 TKWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFK
:::.:::: .:: .::::::::.::.:. :: .: . .:. : ..:...:.:.:::.:
CCDS88 TKWELLQQVNTS--TGTNNLEPLLENYIGDLRRQVDLLSAEQMRQNAEVRSMQDVVEDYK
200 210 220 230 240 250
290 300 310 320 330 340
pF1KE6 KKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQ
.::::::::::..::.::.::::::.::..::.:...::.: :..::. :. .::::.:
CCDS88 SKYEDEINKRTGSENDFVVLKKDVDAAYVSKVDLESRVDTLTGEVNFLKYLFLTELSQVQ
260 270 280 290 300 310
350 360 370 380 390 400
pF1KE6 SHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRH
.:::::.:.::::::::::::::: ::.::: :::::: ::::::::: ::: :::::
CCDS88 THISDTNVILSMDNNRSLDLDSIIDAVRTQYELIAQRSKDEAEALYQTKYQELQITAGRH
320 330 340 350 360 370
410 420 430 440 450 460
pF1KE6 GDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQEL
::::.:.: :: :::: .:::.::: .:::: ..:. :..::..::.::.:: :::.:
CCDS88 GDDLKNSKMEIAELNRTVQRLQAEISNVKKQIEQMQSLISDAEERGEQALQDAWQKLQDL
380 390 400 410 420 430
470 480 490 500 510 520
pF1KE6 QAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVS
. ::::.:..::::::::: ...:::.:::::::::.:::::: ::::: : ::::: .
CCDS88 EEALQQSKEELARLLRDYQAMLGVKLSLDVEIATYRQLLEGEESRMSGELQSHVSISVQN
440 450 460 470 480 490
530 540 550 560 570 580
pF1KE6 SSTT-SASAGG---YG-GGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSG
:... ...::: :: :::::: ::: ::: : ::.. : . ::: : : : :::: :
CCDS88 SQVSVNGGAGGGGSYGSGGYGGGSGGGYGGGRSYRGGGARGRS-GGGYGSGCGGGGGSYG
500 510 520 530 540 550
590 600 610 620
pF1KE6 FSGGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
:: :: ::
CCDS88 GSGRSGRGSSRVQIIQTSTNTSHRRILE
560 570
628 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 15:56:32 2016 done: Tue Nov 8 15:56:33 2016
Total Scan time: 3.530 Total Display time: 0.140
Function used was FASTA [36.3.4 Apr, 2011]