FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7222, 455 aa
1>>>pF1KB7222 455 - 455 aa - 455 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.0660+/-0.000942; mu= 11.7751+/- 0.057
mean_var=193.2913+/-36.976, 0's: 0 Z-trim(112.5): 114 B-trim: 19 in 2/53
Lambda= 0.092250
statistics sampled from 13101 (13222) to 13101 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.743), E-opt: 0.2 (0.406), width: 16
Scan time: 3.440
The best scores are: opt bits E(32554)
CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 3025 415.1 7.6e-116
CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 2004 279.2 6.2e-75
CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1899 265.2 9.8e-71
CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1872 261.6 1.1e-69
CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1783 249.7 4.1e-66
CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1770 248.0 1.4e-65
CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1765 247.3 2.1e-65
CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1648 231.8 1.1e-60
CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1551 218.9 9.1e-57
CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1534 216.6 4.1e-56
CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1484 210.0 4.1e-54
CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1320 188.2 1.6e-47
CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1290 184.1 2.4e-46
CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1279 182.7 7e-46
CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1270 181.5 1.6e-45
CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1266 181.0 2.3e-45
CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1247 178.4 1.2e-44
CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1242 177.7 1.9e-44
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1180 169.6 7.4e-42
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1148 165.3 1.3e-40
CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1095 158.3 1.8e-38
CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1093 157.9 1.8e-38
CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1063 153.9 3.1e-37
CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1044 151.4 1.8e-36
CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 993 144.6 1.9e-34
CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 990 144.2 2.5e-34
CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 985 143.7 5e-34
CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 969 141.4 1.8e-33
CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 946 138.3 1.4e-32
CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 709 106.6 3.4e-23
CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 617 94.6 2.3e-19
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 604 92.9 7.9e-19
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 601 92.5 1.1e-18
CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 598 92.1 1.3e-18
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 594 91.6 2e-18
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 591 91.1 2.4e-18
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 591 91.1 2.4e-18
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 591 91.1 2.4e-18
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 591 91.2 2.6e-18
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 593 91.7 3.3e-18
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 587 90.7 4.3e-18
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 580 89.7 7.4e-18
CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 569 88.2 2e-17
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 562 87.3 3.7e-17
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 551 85.8 1e-16
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 551 85.9 1.1e-16
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 548 85.5 1.5e-16
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 541 84.6 2.8e-16
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 536 83.8 4.1e-16
CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 525 82.7 1.9e-15
>>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 (455 aa)
initn: 3025 init1: 3025 opt: 3025 Z-score: 2193.3 bits: 415.1 E(32554): 7.6e-116
Smith-Waterman score: 3025; 100.0% identity (100.0% similar) in 455 aa overlap (1-455:1-455)
10 20 30 40 50 60
pF1KB7 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 YRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 ENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAAD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 DFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 SLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 SSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMIT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 NVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPS
370 380 390 400 410 420
430 440 450
pF1KB7 KSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF
:::::::::::::::::::::::::::::::::::
CCDS11 KSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF
430 440 450
>>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 (467 aa)
initn: 2048 init1: 1843 opt: 2004 Z-score: 1458.7 bits: 279.2 E(32554): 6.2e-75
Smith-Waterman score: 2004; 70.1% identity (86.1% similar) in 445 aa overlap (1-445:1-437)
10 20 30 40 50 60
pF1KB7 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSS
::.. ::.::.:. :..:: .:::.. : .::..:::. .: .:. ::. .
CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRVSSIRSVGSCRVPSLAGAAGYISSARSGLSGLG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQ
::::. : . .... :.:::: :: ..:.:::::: ::::::.:::::::::.
CCDS11 ----SCLPGSYLSSECHTSGFVGSGGWFCEGSFNGSEKETMQFLNDRLANYLEKVRQLER
70 80 90 100 110
130 140 150 160 170 180
pF1KB7 ENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAAD
::: :::::.:: : :.::.::::::::.:::..:.: : .:.::::::..:::::::::
CCDS11 ENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENARLVLQIDNAKLAAD
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB7 DFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVN
:::::::::.:::::::.::::::::::.:::::.:::::::::::::.::::::::::.
CCDS11 DFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEELMCLKKNHEEEVS
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB7 SLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVV
::::::::::::::::::::::..::.::::::.::::::::.: :..::.::::::::
CCDS11 VLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAWFNTQTEELNQQVV
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB7 SSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMIT
::::::: ::.:::::::::::::::::::::::..:::::::::::::::::::::.:.
CCDS11 SSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEARYSSQLAQMQCLIS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB7 NVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPS
::::::.::: :::::::::::::::.:::: :: ::: :::.:: ::: .::: .:
CCDS11 NVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCKLPPQPCATACKPV
360 370 380 390 400 410
430 440 450
pF1KB7 KSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF
.: .: . : ::. :.: :
CCDS11 IR-VPSVPPVPCVPSVP---CTPAPQVGTQIRTITEEIRDGKVISSREHVQSRPL
420 430 440 450 460
>>CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 (448 aa)
initn: 1943 init1: 1798 opt: 1899 Z-score: 1383.4 bits: 265.2 E(32554): 9.8e-71
Smith-Waterman score: 1915; 66.8% identity (82.3% similar) in 464 aa overlap (1-455:1-448)
10 20 30 40 50
pF1KB7 MASKCLKAGFSSGSLKS-PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRS
:.:.: .. ..:::: : :: :. :. : .:.: :.: .
CCDS11 MTSSCCVTNNLQASLKSCPRPASVCSSGVNC--RPELCLGYVCQPMACLPSVCLP----T
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 SYRATSCLPAL-----CLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK
..: .::: : :.:.. :. : :.:..:: ..:::::::: ::::::.:: .
CCDS11 TFRPASCLSKTYLSSSCQAASGISGSM-GPGSWYSEGAFNGNEKETMQFLNDRLASYLTR
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN
::::::::: :::::.: ..:: : :::::.::::::::.: ::.::::::.::.:::
CCDS11 VRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDN
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN
:::::::::.:::.:...:::::.::::::::::::::::.:::::::::::::.:::::
CCDS11 AKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB7 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE
:::::.:::::::::::.::::::::::.:::::::::::..:: ::::.:.:.. : ::
CCDS11 HEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB7 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ
:::::..::::::. :..::.::::::.::::::::::.::.::.::.:.::::::::::
CCDS11 LNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB7 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA
::::::::::::::::::::::::::::::::::::: ::::::.:::.:: :::::::.
CCDS11 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCS
360 370 380 390 400 410
420 430 440 450
pF1KB7 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPI---CVPCPGGRF
.:: : :.:. : . :: : :: . : ::: ::.
CCDS11 ---TPS--CTTCVPS----PCVPRTVCVPRTVGMPCSPCPQGRY
420 430 440
>>CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 (416 aa)
initn: 1846 init1: 1756 opt: 1872 Z-score: 1364.4 bits: 261.6 E(32554): 1.1e-69
Smith-Waterman score: 1872; 71.9% identity (86.3% similar) in 409 aa overlap (49-450:3-411)
20 30 40 50 60 70
pF1KB7 GGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLG-RSSYRATSCLPALC----LP
.. : .:. :.: . :.: : ::
CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHSCTLP
10 20 30
80 90 100 110 120 130
pF1KB7 AGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQENASLESRIREWC
.. . .. .:: :: ..:.:::::: ::::::.:::::::::..:: ::. :::
CCDS11 GACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERS
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB7 EQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADDFRTKYETEVSLR
.:: : .::.:::::.::::::.: ::.:.:::::::.:::::::::::::::.::.:::
CCDS11 QQQEPLLCPSYQSYFKTIEELQQKILCTKSENARLVVQIDNAKLAADDFRTKYQTELSLR
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB7 QLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNSLRCQLGDRLNVE
:::::::::::::::.:::::::::::::::::::::::.:::.:::.::::::::::::
CCDS11 QLVESDINGLRRILDELTLCKSDLEAQVESLKEELLCLKSNHEQEVNTLRCQLGDRLNVE
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB7 VDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEI
::::: :::::::.: : :::.:::.:::..:.:. ::.::::.::::::::::: ::::
CCDS11 VDAAPTVDLNRVLNETRSQYEALVETNRREVEQWFTTQTEELNKQVVSSSEQLQSYQAEI
220 230 240 250 260 270
320 330 340 350 360 370
pF1KB7 IELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQLAEIRADL
::::::::::::::::::..::.::.::.:.::::::::.:.: .:::::.::::::.::
CCDS11 IELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDL
280 290 300 310 320 330
380 390 400 410 420 430
pF1KB7 ERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPSKSCLPCL--PAAS
:::::::::::::::::::::::::.:::::: .:: :::: . :: ::: : .:
CCDS11 ERQNQEYQVLLDVRARLECEINTYRSLLESEDCNLPSNPCATTNACSKPIGPCLSNPCTS
340 350 360 370 380 390
440 450
pF1KB7 CGPSAARTNCSPRPICVPCPGGRF
: : : : :.::: : ::
CCDS11 CVPPAPCTPCAPRPRCGPCNSFVR
400 410
>>CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 (404 aa)
initn: 1775 init1: 1740 opt: 1783 Z-score: 1300.5 bits: 249.7 E(32554): 4.1e-66
Smith-Waterman score: 1799; 70.3% identity (84.3% similar) in 414 aa overlap (34-443:2-398)
10 20 30 40 50 60
pF1KB7 KCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSSYRA
: :: ::::: : :.: .
CCDS11 MSYSCGLPSLS--------C-----RTSCSS
10
70 80 90 100 110
pF1KB7 TSCLPALC----LPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLE
:.: : ::.. . .. .:: :: ..:.:::::: ::::::.:::::::::
CCDS11 RPCVPPSCHGCTLPGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLE
20 30 40 50 60 70
120 130 140 150 160 170
pF1KB7 QENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAA
..:: ::. ::: .:: : .: .:::::.::::::.: ::::.:::::::.:::::::.
CCDS11 RDNAELENLIRERSQQQEPLVCASYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAS
80 90 100 110 120 130
180 190 200 210 220 230
pF1KB7 DDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEV
::::::::::.::::::::::::::::::.::::.::::::::::::::::::.:::.::
CCDS11 DDFRTKYETELSLRQLVESDINGLRRILDELTLCRSDLEAQVESLKEELLCLKQNHEQEV
140 150 160 170 180 190
240 250 260 270 280 290
pF1KB7 NSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQV
:.::::::::::::::::: ::::.::.: : :::.:::.:::..:.:. ::.::::.::
CCDS11 NTLRCQLGDRLNVEVDAAPTVDLNQVLNETRSQYEALVETNRREVEQWFATQTEELNKQV
200 210 220 230 240 250
300 310 320 330 340 350
pF1KB7 VSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMI
::::::::: ::::::::::::::::::::::..::.::.::.:.::::::::.:.: .:
CCDS11 VSSSEQLQSYQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQRLI
260 270 280 290 300 310
360 370 380 390 400 410
pF1KB7 TNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSP
::::.::::::.:::::::::::::::::::::::::::.:::::: ::: :::: .
CCDS11 TNVESQLAEIRSDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNAC
320 330 340 350 360 370
420 430 440 450
pF1KB7 SKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF
.:: ::. . :: :. :.:
CCDS11 DKSTGPCI-SNPCG---LRARCGPCNTFGY
380 390 400
>>CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 (436 aa)
initn: 1725 init1: 1725 opt: 1770 Z-score: 1290.8 bits: 248.0 E(32554): 1.4e-65
Smith-Waterman score: 1770; 71.9% identity (87.8% similar) in 384 aa overlap (48-426:44-427)
20 30 40 50 60 70
pF1KB7 PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLG-RSSYRATSCLPALC----L
:.: : .:: :.: . :.: : :
CCDS11 KGLQRKERLKPAHIHLQQLTCFSITCSSTMSYSCCLPSLGCRTSCSSRPCVPPSCHGYTL
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB7 PAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQENASLESRIREW
:.. . .. .:: :: ..:.:::::: ::::::.:::::::::..:: ::. :.:
CCDS11 PGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELEKLIQER
80 90 100 110 120 130
140 150 160 170 180 190
pF1KB7 CEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADDFRTKYETEVSL
.:: : .::.:::::.::::::.: ::.:::::::::.:::::::.::::.::.:: ::
CCDS11 SQQQEPLLCPSYQSYFKTIEELQQKILCAKAENARLVVNIDNAKLASDDFRSKYQTEQSL
140 150 160 170 180 190
200 210 220 230 240 250
pF1KB7 RQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNSLRCQLGDRLNV
: :::::::..:::::.:::::::::.:::::.:::.:::::::::::.:: ::::::::
CCDS11 RLLVESDINSIRRILDELTLCKSDLESQVESLREELICLKKNHEEEVNTLRSQLGDRLNV
200 210 220 230 240 250
260 270 280 290 300 310
pF1KB7 EVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAE
:::.:: ::::.::.: : :::.::: :::..:.:. ::.::::.:::::::::::::::
CCDS11 EVDTAPTVDLNQVLNETRSQYEALVEINRREVEQWFATQTEELNKQVVSSSEQLQSCQAE
260 270 280 290 300 310
320 330 340 350 360 370
pF1KB7 IIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQLAEIRAD
:::::::::::::::::::..::.::.::.:.::.:::::.:.: .:::::.:::::: :
CCDS11 IIELRRTVNALEIELQAQHNLRDSLENTLTESEAHYSSQLSQVQSLITNVESQLAEIRCD
320 330 340 350 360 370
380 390 400 410 420 430
pF1KB7 LERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPSKSCLPCLPAASC
::::::::::::::::::::::::::.:::::: :::::::: . ..:: ::
CCDS11 LERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPCNPCATTNASGNSCGPCGTSQKG
380 390 400 410 420 430
440 450
pF1KB7 GPSAARTNCSPRPICVPCPGGRF
CCDS11 CCN
>>CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 (404 aa)
initn: 1734 init1: 1690 opt: 1765 Z-score: 1287.6 bits: 247.3 E(32554): 2.1e-65
Smith-Waterman score: 1765; 71.0% identity (86.1% similar) in 396 aa overlap (49-434:3-398)
20 30 40 50 60 70
pF1KB7 GGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLG-RSSYRATSCLPALC----LP
.. : .:. :.: . :.: : ::
CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHGYTLP
10 20 30
80 90 100 110 120 130
pF1KB7 AGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQENASLESRIREWC
.. . .. .:: :: ..:.:::::: ::::::.:::::::::..:: ::. :::
CCDS11 GACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERS
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB7 EQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADDFRTKYETEVSLR
.:: : .::.:::::.::::::.: ::::.:::::::.:::::::::::::::.:: :::
CCDS11 QQQEPLLCPSYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAADDFRTKYQTEQSLR
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB7 QLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNSLRCQLGDRLNVE
::::::::.::::::.::::.::::::.:::::::: ::.:::.:::.::::::::::::
CCDS11 QLVESDINSLRRILDELTLCRSDLEAQMESLKEELLSLKQNHEQEVNTLRCQLGDRLNVE
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB7 VDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEI
::::: ::::.::.: : :::.:::.:::..:.:. ::.::::.::::::::::: ::::
CCDS11 VDAAPAVDLNQVLNETRNQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQAEI
220 230 240 250 260 270
320 330 340 350 360 370
pF1KB7 IELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQLAEIRADL
::::::::::::::::::..: .::.::.:.::::::::.:.: .:::::.::::::.::
CCDS11 IELRRTVNALEIELQAQHNLRYSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDL
280 290 300 310 320 330
380 390 400 410 420
pF1KB7 ERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYS---PSKSCL--PCLP
:::::::::::::::::::::::::.:::::: ::: :::: . : ::. :: :
CCDS11 ERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACEKPIGSCVTNPCGP
340 350 360 370 380 390
430 440 450
pF1KB7 AASCGPSAARTNCSPRPICVPCPGGRF
. :::
CCDS11 RSRCGPCNTFGY
400
>>CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 (431 aa)
initn: 1645 init1: 1619 opt: 1648 Z-score: 1203.1 bits: 231.8 E(32554): 1.1e-60
Smith-Waterman score: 1655; 59.8% identity (81.3% similar) in 438 aa overlap (1-432:1-424)
10 20 30 40 50
pF1KB7 MASKCLKAGFSSGSLKSPGG---ASGGSTRVSAMY---SSSSCKLPSLSPVARSFSACSV
:.: : .. : : . .: ::. :.... . ..: :. ::. .:....: .
CCDS42 MTSDCSSTHCSPESCGTASGCAPASSCSVETACLPGTCATSRCQTPSFLSRSRGLTGCLL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 GLGRSSYRATSCLPALCLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK
: . :: . :: :. .: .:..:.::::::: ::::::.::::
CCDS42 ----PCYFTGSC-NSPCL---------VGNCAWCEDGVFTSNEKETMQFLNDRLASYLEK
70 80 90 100
120 130 140 150 160 170
pF1KB7 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN
::.::. :: :::::.: :::..:..::::: :: :::.::.: ::.::::.::.:..::
CCDS42 VRSLEETNAELESRIQEQCEQDIPMVCPDYQRYFNTIEDLQQKILCTKAENSRLAVQLDN
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB7 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN
:::.:::..:::.:.:::::.:.::..:. ::..::::::::::.::::::.:::::::
CCDS42 CKLATDDFKSKYESELSLRQLLEADISSLHGILEELTLCKSDLEAHVESLKEDLLCLKKN
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB7 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE
:::::: :: ::::::.::.:.:: .::::::.::::: ::.. ::::.::.:: .:.::
CCDS42 HEEEVNLLREQLGDRLSVELDTAPTLDLNRVLDEMRCQCETVLANNRREAEEWLAVQTEE
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB7 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ
:::: .::.::::.:: ::.::.::..:::::::::.:. ..:: :.:::::.:::::::
CCDS42 LNQQQLSSAEQLQGCQMEILELKRTASALEIELQAQQSLTESLECTVAETEAQYSSQLAQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB7 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA
.::.: :.: :::::: :::::::::::::::.:::: ::::: :::.::::.: :.::.
CCDS42 IQCLIDNLENQLAEIRCDLERQNQEYQVLLDVKARLEGEINTYWGLLDSEDSRLSCSPCS
350 360 370 380 390 400
420 430 440 450
pF1KB7 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF
. :..: :: . :
CCDS42 TTCTSSNTCEPCSAYVICTVENCCL
410 420 430
>>CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 (491 aa)
initn: 1507 init1: 1484 opt: 1551 Z-score: 1132.7 bits: 218.9 E(32554): 9.1e-57
Smith-Waterman score: 1551; 55.3% identity (77.2% similar) in 461 aa overlap (7-454:4-456)
10 20 30 40 50
pF1KB7 MASKCLKAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACS-VGLGRS
:. ...: ..: . : ::.. :...:. : . . . :. .:
CCDS11 MDTKGCTTTNSPSTPCQNCSRITNVSTISSNNGCH-----PGGLTVNNCQPAGHVLR
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 SYRATSCLPA--LCL-PA---GGFATSYS-GGGGWFGEGILTGNEKETMQSLNDRLAGYL
.: :. .: : ..: . .: .:.:::: ..::::::: ::.:::.::
CCDS11 IPWDQGCQPTPRFCRKPIYLMNNFNARFSLDDCSWYGEGI-NSNEKETMQILNERLANYL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 EKVRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEI
.:::.::.::: :::.:.: ....: .:::: ::. ::::::.: ::.::::.::: .:
CCDS11 QKVRMLERENAELESKIQEESNKELPVLCPDYLSYYTTIEELQQKILCTKAENSRLVSQI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 DNAKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLK
::.::.:::.:.:::.::::::::::: :::..::. ::: :.::::::.::::::::::
CCDS11 DNTKLTADDLRAKYEAEVSLRQLVESDANGLKQILNVLTLGKADLEAQVQSLKEELLCLK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB7 KNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQS
.::.::.:::.::::.::..:: ::: .:::.::.::::::: ..:.::.:.:.:..::
CCDS11 NNHKEEINSLQCQLGERLDIEVTAAPSADLNQVLQEMRCQYEPIMETNRKDVEQWFNTQI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB7 EELNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQL
::::::::.::.: : :: :::::::.::.::.:::::: :::. : :.::::::.. :
CCDS11 EELNQQVVTSSQQQQCCQKEIIELRRSVNTLEVELQAQHRMRDSQECILTETEARYTALL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB7 AQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNP
.:.: .: :.:::::::: ::::::::..::::..::::::.:::.:::: :.: :: :
CCDS11 TQIQSLIDNLEAQLAEIRCALERQNQEYEILLDVKSRLECEITTYRSLLESSDGKRPCYP
360 370 380 390 400 410
420 430 440 450
pF1KB7 ----CAPDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPC-PGGRF
: : :: :: .. .. . :: . : : : .:
CCDS11 RATKCEP--SPWTSCKSGAIESTAPACTSSSPCSLKEHCSACGPLSRILVKICTITKEIK
420 430 440 450 460
CCDS11 DGKVISSYEHVQPCFIIRPAKV
470 480 490
>>CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 (456 aa)
initn: 1491 init1: 1426 opt: 1534 Z-score: 1120.8 bits: 216.6 E(32554): 4.1e-56
Smith-Waterman score: 1534; 59.1% identity (76.7% similar) in 425 aa overlap (37-455:44-456)
10 20 30 40 50 60
pF1KB7 KAGFSSGSLKSPGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRSSYRATSC
: : ... . : . :. ::: : :
CCDS11 CTMAPGARNVSVSPIDIGCQPGAEANIAPMCLLANVAHANR-VRVGSTPLGRPSL----C
20 30 40 50 60
70 80 90 100 110 120
pF1KB7 LPALC-----LPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRQLEQE
:: : ::. . : : .::. :.:.:::::: ::::::.:::::::::::
CCDS11 LPPTCHTACPLPGTCHIPGNIGICGAYGENTLNGHEKETMQFLNDRLANYLEKVRQLEQE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 NASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDNAKLAADD
:: ::. . : . . .::::::::.::::::.: ::::::::::.:.::::::::::
CCDS11 NAELEATLLERSKCHESTVCPDYQSYFHTIEELQQKILCSKAENARLIVQIDNAKLAADD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 FRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKNHEEEVNS
:: : :.: :::::::.: : ...::: :: :.::::: :::::: : ::.:::.::.
CCDS11 FRIKLESERSLRQLVEADKCGTQKLLDDATLAKADLEAQQESLKEEQLSLKSNHEQEVKI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 LRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEELNQQVVS
:: :::..: .:.: : .:::::: ::: :::...:.::.:.:.:...::: .. : .:
CCDS11 LRSQLGEKLRIELDIEPTIDLNRVLGEMRAQYEAMLETNRQDVEQWFQAQSEGISLQDMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 SSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITN
::.:: ::.::.::: ::::::.: ::::...: :...: :.: :....::::: .:.:
CCDS11 CSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNSLCEAEDRFGTELAQMQSLISN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 VEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCAPDYSPSK
:: ::.:::::::::::::::::::..::: :: :::.:::::: :::::::. :::
CCDS11 VEEQLSEIRADLERQNQEYQVLLDVKTRLENEIATYRNLLESEDCKLPCNPCST--SPSC
370 380 390 400 410 420
430 440 450
pF1KB7 SCLPCLPAASCGPSAARTNCSPRPIC-VPCPGGRF
:: : :::: :.:.: : . :.::
CCDS11 VTAPCAPRPSCGPC---TTCGPT--CGASTTGSRF
430 440 450
455 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 20:28:14 2016 done: Fri Nov 4 20:28:14 2016
Total Scan time: 3.440 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]