FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7993, 469 aa
1>>>pF1KB7993 469 - 469 aa - 469 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.3178+/-0.00126; mu= -0.3496+/- 0.075
mean_var=243.8506+/-48.856, 0's: 0 Z-trim(108.4): 120 B-trim: 69 in 1/51
Lambda= 0.082132
statistics sampled from 10077 (10189) to 10077 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.313), width: 16
Scan time: 2.570
The best scores are: opt bits E(32554)
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 2904 357.6 1.6e-98
CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 1741 219.9 5.8e-57
CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 1722 217.6 2.7e-56
CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 1710 216.2 7.2e-56
CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 1709 216.1 7.8e-56
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1707 215.8 9e-56
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1693 214.1 2.6e-55
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1693 214.1 2.7e-55
CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 1623 205.9 9.9e-53
CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 1616 205.0 1.5e-52
CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1595 202.5 8.7e-52
CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 1569 199.5 8.4e-51
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1558 198.2 2e-50
CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1548 197.0 4.2e-50
CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1546 196.7 4.7e-50
CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 1514 193.0 7.8e-49
CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1494 190.6 3.4e-48
CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 1467 187.4 3.4e-47
CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1465 187.1 3.7e-47
CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 1430 183.1 7.7e-46
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1388 178.0 2e-44
CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1387 177.9 2.2e-44
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1372 176.1 7.6e-44
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1348 173.3 5.4e-43
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1347 173.1 5.7e-43
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1333 171.5 1.8e-42
CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1165 151.5 1.5e-36
CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1063 139.4 7.2e-33
CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 1057 138.7 1.1e-32
CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 1027 135.2 1.4e-31
CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 890 118.8 7.7e-27
CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 795 107.7 2.7e-23
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 793 107.5 3.6e-23
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 765 104.1 3e-22
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 753 102.7 8e-22
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 753 102.7 8.1e-22
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 750 102.4 1.1e-21
CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 741 101.3 2.3e-21
CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 709 97.5 3.3e-20
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 699 96.6 1.2e-19
CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 638 89.1 1e-17
CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 622 87.2 3.9e-17
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 617 86.7 7.1e-17
CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 608 85.5 1.2e-16
CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 615 86.6 1.3e-16
CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 603 85.0 1.9e-16
CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 598 84.4 2.9e-16
CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 592 83.6 4.2e-16
CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 587 83.0 6.5e-16
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 585 82.8 8.7e-16
>>CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 (469 aa)
initn: 2904 init1: 2904 opt: 2904 Z-score: 1882.2 bits: 357.6 E(32554): 1.6e-98
Smith-Waterman score: 2904; 99.6% identity (100.0% similar) in 469 aa overlap (1-469:1-469)
10 20 30 40 50 60
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYGGPVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYGGPVG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 TKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 TKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 EDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQI
:::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 EDEINHRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 SDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 SDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 LRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 LQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNSTG
:::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LQRGKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNSTG
370 380 390 400 410 420
430 440 450 460
pF1KB7 GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD
430 440 450 460
>>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa)
initn: 1895 init1: 1328 opt: 1741 Z-score: 1136.1 bits: 219.9 E(32554): 5.8e-57
Smith-Waterman score: 1756; 61.7% identity (80.4% similar) in 491 aa overlap (1-468:74-559)
10 20 30
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSAR
.:: :. : .: .: .: : ..:
CCDS88 GGFGRVSLAGACGVGGYGSRSLYNLGGSKRISISTSGGSFRNRFGAGAGGGYGFG-GGAG
50 60 70 80 90 100
40 50 60 70 80
pF1KB7 PG---GLGSSSLYGLGASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADP
: : :... .:::.. .. ...::: .::.:::.:::::.:: :. ::
CCDS88 SGFGFGGGAGGGFGLGGG---AGFGGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDP
110 120 130 140 150
90 100 110 120 130 140
pF1KB7 SLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDI
:.:::: :: :::::::::::::::::::::::::.:.::::::::: . :. : : .
CCDS88 SIQRVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGT-KTVRQNLEPL
160 170 180 190 200 210
150 160 170 180 190 200
pF1KB7 FEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKD
:: : .:: ::... . :::..:::.:::.:::::::::::::.::.::::::.::::
CCDS88 FEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEINKRTTAENEFVMLKKD
220 230 240 250 260 270
210 220 230 240 250 260
pF1KB7 VDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGI
::::::.::::::::::: :::::.. . ..::...:...:::::::::::.:.::::.:
CCDS88 VDAAYMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTSVVLSMDNNRNLDLDSI
280 290 300 310 320 330
270 280 290 300 310 320
pF1KB7 IAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQA
::::::::::.:. ::.:::.:::::.: :: ::.::::::::..::::::: ::::.:
CCDS88 IAEVKAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNTKHEISEMNRMIQRLRA
340 350 360 370 380 390
330 340 350 360 370 380
pF1KB7 EIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMS
::::.:.: :.:. :::.::.:::::::::: : ::: :::.::::::: ::::::::.
CCDS88 EIDNVKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQKAKQDMARLLREYQELMN
400 410 420 430 440 450
390 400 410 420 430
pF1KB7 VKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNST------GGSSSGGGIGLTLGG
.:::::.::::::::::::: ::.:.::: :::::..:. .::. :::.: :::
CCDS88 TKLALDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSSGYGSGSGYGGGLGGGLGG
460 470 480 490 500 510
440 450 460
pF1KB7 TMG-------SNALSFSSSAGPGLLKAYSIRTASASRRSARD
.: :.. :::.: :: . :. .. : :.:
CCDS88 GLGGGLAGGSSGSYYSSSSGGVGLGGGLSVGGSGFSASSGRGLGVGFGSGGGSSSSVKFV
520 530 540 550 560 570
CCDS88 STTSSSRKSFKS
580 590
>>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa)
initn: 1794 init1: 1311 opt: 1722 Z-score: 1124.2 bits: 217.6 E(32554): 2.7e-56
Smith-Waterman score: 1722; 64.3% identity (84.9% similar) in 445 aa overlap (14-450:90-524)
10 20 30 40
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG
: .:.: :. .. :: : . .:::
CCDS41 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG
60 70 80 90 100 110
50 60 70 80 90
pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
.. ... ...::: .::.:::.:::::.:: :. ::..:::: :: ::::::
CCDS41 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPTIQRVRAEEREQIKTL
120 130 140 150 160 170
100 110 120 130 140 150
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ
:::::::::::::::::::.::::::::::: . :. : : .:: : .:: ::...
CCDS41 NNKFASFIDKVRFLEQQNKVLETKWTLLQEQGT-KTVRQNLEPLFEQYINNLRRQLDSIV
180 190 200 210 220
160 170 180 190 200 210
pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD
. :::..:::.:::.:::::::::::::.:::::::::.::::::::::.::::.::.:
CCDS41 GERGRLDSELRGMQDLVEDFKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD
230 240 250 260 270 280
220 230 240 250 260 270
pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR
.:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. ::
CCDS41 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR
290 300 310 320 330 340
280 290 300 310 320 330
pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI
::::.:::::.: ::. ::.::::::::..::.:.:: ::::..:::..:.: :.:.:::
CCDS41 AEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAI
350 360 370 380 390 400
340 350 360 370 380 390
pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL
:.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.:::::::::
CCDS41 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL
410 420 430 440 450 460
400 410 420 430 440 450
pF1KB7 EGEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLG-GTMGSNALSFSSSAGPGLLKAY
:::: :: :.::: :::::..:: .:. ::. :. : : :... :..:. : :
CCDS41 EGEECRLNGEGVGQVNISVVQSTVSSGYGGASGVGSGLGLGGGSSYSYGSGLGVGGGFSS
470 480 490 500 510 520
460
pF1KB7 SIRTASASRRSARD
CCDS41 SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
530 540 550 560
>>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa)
initn: 1833 init1: 1304 opt: 1710 Z-score: 1116.5 bits: 216.2 E(32554): 7.2e-56
Smith-Waterman score: 1710; 63.6% identity (84.9% similar) in 445 aa overlap (14-450:90-524)
10 20 30 40
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG
: .:.: :. .. :: : . .:::
CCDS88 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG
60 70 80 90 100 110
50 60 70 80 90
pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
.. ... ...::: .::.:::.:::::.:: :. ::..:::: :: ::::::
CCDS88 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTL
120 130 140 150 160 170
100 110 120 130 140 150
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ
:::::::::::::::::::.:.::::::::: . :. : : .:: : .:: ::...
CCDS88 NNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGT-KTVRQNLEPLFEQYINNLRRQLDSIV
180 190 200 210 220
160 170 180 190 200 210
pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD
. :::..:::.:::.:::.:::::::::.:::::::::.::::::::::.::::.::.:
CCDS88 GERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD
230 240 250 260 270 280
220 230 240 250 260 270
pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR
.:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. ::
CCDS88 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR
290 300 310 320 330 340
280 290 300 310 320 330
pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI
::::.:::::.: ::. ::.::::::::..::.:.:: ::::..:::..:.: :.:.:::
CCDS88 AEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCASLQAAI
350 360 370 380 390 400
340 350 360 370 380 390
pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL
:.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.:::::::::
CCDS88 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL
410 420 430 440 450 460
400 410 420 430 440 450
pF1KB7 EGEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLG-GTMGSNALSFSSSAGPGLLKAY
:::: :: :.::: ::.::..:: .:. ::. :. : : :... :..:. : :
CCDS88 EGEECRLNGEGVGQVNVSVVQSTISSGYGGASGVGSGLGLGGGSSYSYGSGLGIGGGFSS
470 480 490 500 510 520
460
pF1KB7 SIRTASASRRSARD
CCDS88 SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
530 540 550 560
>>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa)
initn: 1780 init1: 1302 opt: 1709 Z-score: 1115.9 bits: 216.1 E(32554): 7.8e-56
Smith-Waterman score: 1709; 63.1% identity (83.5% similar) in 461 aa overlap (14-463:90-535)
10 20 30 40
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG
: .:.: :. .. :: : . .:::
CCDS88 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG
60 70 80 90 100 110
50 60 70 80 90
pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
.. ... ...::: .::.:::.:::::.:: :. ::..:::: :: ::::::
CCDS88 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTL
120 130 140 150 160 170
100 110 120 130 140 150
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ
:::::::::::::::::::.:.::::::::: ..:. : : .:: : .:: ::. .
CCDS88 NNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ-GTKTVRQNLEPLFEQYINNLRRQLDNIV
180 190 200 210 220
160 170 180 190 200 210
pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD
. :::..:::.:::.:::.:::::::::.:::::::::.::::::::::.::::.::.:
CCDS88 GERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD
230 240 250 260 270 280
220 230 240 250 260 270
pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR
.:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. ::
CCDS88 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR
290 300 310 320 330 340
280 290 300 310 320 330
pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI
::::.:::::.: :: ::.::::::::..::.:.:: ::::..:::..:.: :.:.:::
CCDS88 AEAESWYQTKYEELQITAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAI
350 360 370 380 390 400
340 350 360 370 380 390
pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL
:.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.:::::::::
CCDS88 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL
410 420 430 440 450 460
400 410 420 430 440 450
pF1KB7 EGEESRLAGDGVGAVNISVMNST---G-GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLL
:::: :: :.::: :::::..:: : :..:: : :: ::: :: :.: ..: :.
CCDS88 EGEECRLNGEGVGQVNISVVQSTVSSGYGGASGVGSGLGLGG--GS---SYSYGSGLGVG
470 480 490 500 510 520
460
pF1KB7 KAYSIRTASASRRSARD
..: .. :.
CCDS88 GGFSSSSGRATGGGLSSVGGGSSTIKYTTTSSSSRKSYKH
530 540 550 560
>>CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 (551 aa)
initn: 1787 init1: 1288 opt: 1707 Z-score: 1114.7 bits: 215.8 E(32554): 9e-56
Smith-Waterman score: 1721; 62.2% identity (80.8% similar) in 490 aa overlap (5-451:32-512)
10 20 30
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGL
::: : ..:::: : :. :.::: ...
CCDS88 SRQSSITFQSGSRRGFSTTSAITPAAGRSRFSS-VSVARSAA--GSGGLGRISSA-GASF
10 20 30 40 50
40 50 60
pF1KB7 GSSSLYGLGASRPRVAV-------RSA----------------YGGPVGAG---------
:: :::.::... ::.. ::. ::: ::.:
CCDS88 GSRSLYNLGGAK-RVSINGCGSSCRSGFGGRASNRFGVNSGFGYGGGVGGGFSGPSFPVC
60 70 80 90 100 110
70 80 90 100 110
pF1KB7 ----IREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKL
:.:::.:::::.::.:. ::..:::: :: :::::::::::::::::::::::::.
CCDS88 PPGGIQEVTVNQSLLTPLHLQIDPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKV
120 130 140 150 160 170
120 130 140 150 160 170
pF1KB7 LETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDF
:::::.::::: : .. : : .:.. . :: :::.. .. ::::::::.::::::::
CCDS88 LETKWALLQEQGS-RTVRQNLEPLFDSYTSELRRQLESITTERGRLEAELRNMQDVVEDF
180 190 200 210 220 230
180 190 200 210 220 230
pF1KB7 KNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTEL
: .::::::.:::::::::.::::::::::.:::::::: .: .::::.... ..::..:
CCDS88 KVRYEDEINKRTAAENEFVALKKDVDAAYMNKVELEAKVKSLPEEINFIHSVFDAELSQL
240 250 260 270 280 290
240 250 260 270 280 290
pF1KB7 QSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGK
:.:..::::::::::.:.::::.::::::::::..:. ::::::.:::::.: ::. ::.
CCDS88 QTQVGDTSVVLSMDNNRNLDLDSIIAEVKAQYEDIANRSRAEAESWYQTKYEELQVTAGR
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB7 HGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEE
::::::::..::::::: ::::.::::..:.: ..:..:::.::.:::::::::::: .
CCDS88 HGDDLRNTKQEISEMNRMIQRLRAEIDSVKKQCSSLQTAIADAEQRGELALKDARAKLVD
360 370 380 390 400 410
360 370 380 390 400 410
pF1KB7 LEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVM
:: :::.::::::: ::::::::..:::::.::::::::::::: ::.:.::. :::::.
CCDS88 LEEALQKAKQDMARLLREYQELMNIKLALDVEIATYRKLLEGEECRLSGEGVSPVNISVV
420 430 440 450 460 470
420 430 440 450 460
pF1KB7 NST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD
.:: :..:: :: .: ::: : ::..:.: .:
CCDS88 TSTLSSGYGSGSSIGGGNLGLGGGSG---YSFTTSGGHSLGAGLGGSGFSATSNRGLGGS
480 490 500 510 520 530
CCDS88 GSSVKFVSTTSSSQKSYTH
540 550
>>CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 (483 aa)
initn: 1242 init1: 1242 opt: 1693 Z-score: 1106.6 bits: 214.1 E(32554): 2.6e-55
Smith-Waterman score: 1693; 62.9% identity (81.8% similar) in 472 aa overlap (6-469:9-470)
10 20 30 40 50
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-LGSSSLYGLGASRPRVAVRSAYG
: : :: :::.:. .. ::. ..:::. .:.: : .. ..::
CCDS88 MSIRVTQKSYKVSTSGPRAFSSRS-----YTSGPGSRISSSSFSRVGSSNFRGGLGGGYG
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 GPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQ
: : .:: ::.:::::.:: :..::..: :: .:.:::::::::::::::::::::::
CCDS88 GASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQ
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 NKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVED
::.:::::.:::.::.:.:. . ..::. : .:: :::.: . .::::: .:: .:::
CCDS88 NKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVED
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 FKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTE
::::::::::.:: :::::..::::: :::.:::::.....:.::::::: : : :. :
CCDS88 FKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELESRLEGLTDEINFLRQLYEEEIRE
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB7 LQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAG
:::::::::::::::::::::.:.::::::::::..:. ::::::. :: :.: ::. ::
CCDS88 LQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB7 KHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQE
::::::: :..::::::: :.::::::...:.:::.::::::.::.:::::.::: ::
CCDS88 KHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB7 ELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISV
::::::::::::::::::::::::.::::::::::::::::::::::: . : :.:.
CCDS88 ELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEESRLES---GMQNMSI
360 370 380 390 400 410
420 430 440 450 460
pF1KB7 MNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPGLL-KAYSIRTASASRRSARD
..: :: ::. : ::: : : . ::.:.:: . . .. : :.. ... .::
CCDS88 HTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRD
420 430 440 450 460 470
CCDS88 GKLVSESSDVLPK
480
>>CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 (511 aa)
initn: 1242 init1: 1242 opt: 1693 Z-score: 1106.2 bits: 214.1 E(32554): 2.7e-55
Smith-Waterman score: 1693; 62.9% identity (81.8% similar) in 472 aa overlap (6-469:37-498)
10 20 30
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-L
: : :: :::.:. .. ::. .
CCDS58 SQDLQEGISAWFGPPASTPASTMSIRVTQKSYKVSTSGPRAFSSRS-----YTSGPGSRI
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB7 GSSSLYGLGASRPRVAVRSAYGGPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESE
.:::. .:.: : .. ..::: : .:: ::.:::::.:: :..::..: :: .:.:
CCDS58 SSSSFSRVGSSNFRGGLGGGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKE
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB7 QIKTLNNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLE
::::::::::::::::::::::::.:::::.:::.::.:.:. . ..::. : .:: :::
CCDS58 QIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLE
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB7 ALQVDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEA
.: . .::::: .:: .:::::::::::::.:: :::::..::::: :::.:::::.
CCDS58 TLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELES
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB7 KVDALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAK
....:.::::::: : : :. ::::::::::::::::::::::.:.::::::::::..:.
CCDS58 RLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIAN
250 260 270 280 290 300
280 290 300 310 320 330
pF1KB7 CSRAEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLE
::::::. :: :.: ::. ::::::::: :..::::::: :.::::::...:.:::.::
CCDS58 RSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLE
310 320 330 340 350 360
340 350 360 370 380 390
pF1KB7 AAIAEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYR
::::.::.:::::.::: :: ::::::::::::::::::::::::.:::::::::::::
CCDS58 AAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYR
370 380 390 400 410 420
400 410 420 430 440
pF1KB7 KLLEGEESRLAGDGVGAVNISVMNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAG
:::::::::: . : :.:. ..: :: ::. : ::: : : . ::.:.::
CCDS58 KLLEGEESRLES---GMQNMSIHTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAG
430 440 450 460 470
450 460
pF1KB7 PGLL-KAYSIRTASASRRSARD
. . .. : :.. ... .::
CCDS58 SSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK
480 490 500 510
>>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa)
initn: 1312 init1: 1262 opt: 1623 Z-score: 1060.2 bits: 205.9 E(32554): 9.9e-53
Smith-Waterman score: 1623; 62.8% identity (85.5% similar) in 427 aa overlap (31-450:140-561)
10 20 30 40 50
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYG-GPV
:::.:.:. .: .: . : : ::
CCDS44 GGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGS-----LGSPGGFGPG
110 120 130 140 150 160
60 70 80 90 100 110
pF1KB7 G--AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNK
: .::.::::::::: :: .. ::.. .:. .: :::::::::::::::::::::::::
CCDS44 GFPGGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNK
170 180 190 200 210 220
120 130 140 150 160 170
pF1KB7 LLETKWTLLQEQKSAK---SSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVE
.:::::.:::.: ... .. : .:: .: ::. :. . . :::..::..:.:.::
CCDS44 VLETKWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVE
230 240 250 260 270 280
180 190 200 210 220 230
pF1KB7 DFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELT
:::.:::::::.:::::::::.::::::.:::.::::.:::::: :::.::::: ..::.
CCDS44 DFKKKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELS
290 300 310 320 330 340
240 250 260 270 280 290
pF1KB7 ELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQA
..::.::::::::::::.::::::.:::::.::::..:. :.::::: ::::. ::. :
CCDS44 QMQSHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTA
350 360 370 380 390 400
300 310 320 330 340 350
pF1KB7 GKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQ
:.::::::::..:: :.:: ::::.:::...:.: :.:..::::::..::.::::: ::
CCDS44 GRHGDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKL
410 420 430 440 450 460
360 370 380 390 400 410
pF1KB7 EELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNIS
.::.::::.::.:.:: ::.:::::.::::::.::::::::::::: :..:. .::.::
CCDS44 QELQAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSIS
470 480 490 500 510 520
420 430 440 450 460
pF1KB7 VMNSTGGSSSGGGIGLTLGGTMGSN-ALSFSSSAGPGLLKAYSIRTASASRRSARD
:..:. :.:.:: : :: ::.. . .::...: :
CCDS44 VVSSSTTSASAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFS
530 540 550 560 570 580
CCDS44 GGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR
590 600 610 620
>>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa)
initn: 1683 init1: 1194 opt: 1616 Z-score: 1056.8 bits: 205.0 E(32554): 1.5e-52
Smith-Waterman score: 1616; 59.2% identity (84.3% similar) in 458 aa overlap (12-464:58-509)
10 20 30 40
pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYG
..: ..: :.. . ::.:.... :
CCDS41 GAFSSVSMSGGAGRCSSGGFGSRSLYNLRGNKSISMSVAGSRQGACFGGAGGFGTGGFGG
30 40 50 60 70 80
50 60 70 80 90
pF1KB7 -LGASRPRVAVRSAYGGPV--GAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL
.:.: . ... : :: ..::.:::::::::.::... :: .:.:: :: :::: :
CCDS41 GFGGS---FSGKGGPGFPVCPAGGIQEVTINQSLLTPLHVEIDPEIQKVRTEEREQIKLL
90 100 110 120 130 140
100 110 120 130 140 150
pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR-LPDIFEAQIAGLRGQLEALQV
:::::::::::.:::::::.:::::.:::.: .. ::. : .::. .. :: ::..:
CCDS41 NNKFASFIDKVQFLEQQNKVLETKWNLLQQQTTTTSSKNLEPLFETYLSVLRKQLDTLGN
150 160 170 180 190 200
160 170 180 190 200 210
pF1KB7 DGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDA
: :::..::..::: :::::.:::.:::.::::::.::::::::::::..:::::::::.
CCDS41 DKGRLQSELKTMQDSVEDFKTKYEEEINKRTAAENDFVVLKKDVDAAYLNKVELEAKVDS
210 220 230 240 250 260
220 230 240 250 260 270
pF1KB7 LNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRA
::::::::..: ..::...:...:::::::::::.:.::::.:::::.:::::.:. :.:
CCDS41 LNDEINFLKVLYDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVRAQYEEIAQRSKA
270 280 290 300 310 320
280 290 300 310 320 330
pF1KB7 EAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIA
:::: :::: . :: .. .:::.:.::..::.:.:: ::::.:::.:::.: :....:
CCDS41 EAEALYQTKVQQLQISVDQHGDNLKNTKSEIAELNRMIQRLRAEIENIKKQCQTLQVSVA
330 340 350 360 370 380
340 350 360 370 380 390
pF1KB7 EAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLE
.::.::: :::::..:. :::::::.::...::.::::::::::::::::::::::::::
CCDS41 DAEQRGENALKDAHSKRVELEAALQQAKEELARMLREYQELMSVKLALDIEIATYRKLLE
390 400 410 420 430 440
400 410 420 430 440 450
pF1KB7 GEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLGGTMGSNALS-FSSSAGPGLLKAYS
::: :..:. .::.:::.. ::.: :::. ::. : . : :.:..: :. . :
CCDS41 GEEYRMSGECQSAVSISVVS---GSTSTGGISGGLGSGSGFGLSSGFGSGSGSGFGFGGS
450 460 470 480 490 500
460
pF1KB7 IRTASASRRSARD
. .:.:.
CCDS41 VSGSSSSKIISTTTLNKRR
510 520
469 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 02:36:27 2016 done: Mon Nov 7 02:36:28 2016
Total Scan time: 2.570 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]