FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0564, 448 aa
1>>>pF1KE0564 448 - 448 aa - 448 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.5063+/-0.00119; mu= 9.2167+/- 0.071
mean_var=217.8258+/-41.707, 0's: 0 Z-trim(110.2): 139 B-trim: 107 in 2/52
Lambda= 0.086900
statistics sampled from 11269 (11417) to 11269 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.694), E-opt: 0.2 (0.351), width: 16
Scan time: 2.410
The best scores are: opt bits E(32554)
CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 3005 389.8 3e-108
CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1899 251.1 1.7e-66
CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1885 249.4 5.7e-66
CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1819 241.1 1.6e-63
CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1754 232.9 4.6e-61
CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1752 232.7 5.4e-61
CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1731 230.1 3.5e-60
CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1588 212.1 8.7e-55
CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1564 209.2 7.7e-54
CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1552 207.6 2.1e-53
CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1513 202.7 6.1e-52
CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1227 166.9 3.9e-41
CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1220 166.0 7e-41
CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1208 164.4 1.8e-40
CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1201 163.6 3.5e-40
CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1190 162.3 9.7e-40
CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1176 160.5 3.2e-39
CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1165 159.1 7.9e-39
CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1115 153.0 7.6e-37
CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1087 149.4 7.7e-36
CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1027 141.8 1.3e-33
CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 996 137.9 2e-32
CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 984 136.4 5.7e-32
CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 979 135.8 8.7e-32
CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 980 136.0 8.8e-32
CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 961 133.5 4e-31
CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 909 127.2 4.7e-29
CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 904 126.4 6e-29
CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 892 124.9 1.6e-28
CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 701 100.7 2e-21
CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 608 89.3 8.5e-18
CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 608 89.3 8.5e-18
CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 608 89.3 8.5e-18
CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 595 88.0 4.3e-17
CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 587 86.7 5.5e-17
CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 565 83.9 3.7e-16
CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 542 81.1 2.9e-15
CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 540 80.8 3.4e-15
CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 539 80.7 4e-15
CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 538 80.6 4e-15
CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 536 80.3 4.9e-15
CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 533 79.9 6.2e-15
CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 531 79.7 8e-15
CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 535 80.5 8.4e-15
CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 531 79.8 8.4e-15
CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 526 79.1 1.2e-14
CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 520 78.3 1.9e-14
CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 520 78.3 2e-14
CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 519 78.1 2e-14
CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 516 77.8 2.6e-14
>>CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 (448 aa)
initn: 3005 init1: 3005 opt: 3005 Z-score: 2056.9 bits: 389.8 E(32554): 3e-108
Smith-Waterman score: 3005; 100.0% identity (100.0% similar) in 448 aa overlap (1-448:1-448)
10 20 30 40 50 60
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 NAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 FRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 FRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 LRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVAT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 SSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 VEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTC
370 380 390 400 410 420
430 440
pF1KE0 VPSPCVPRTVCVPRTVGMPCSPCPQGRY
::::::::::::::::::::::::::::
CCDS11 VPSPCVPRTVCVPRTVGMPCSPCPQGRY
430 440
>>CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 (455 aa)
initn: 1943 init1: 1798 opt: 1899 Z-score: 1307.5 bits: 251.1 E(32554): 1.7e-66
Smith-Waterman score: 1915; 67.0% identity (82.3% similar) in 464 aa overlap (1-448:1-455)
10 20 30 40 50
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNC--RPELCLGYVCQPMACLPSVCLP----T
:.:.: .. ..:::: : :: :. :. : .:.: :.: .
CCDS11 MASKCLKAGFSSGSLKS-PGGASGGSTRVSAMYSSSSCKLPSLSPVARSFSACSVGLGRS
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 TFRPASCLSKTYLSSSCQAASGISGSM-GPGSWYSEGAFNGNEKETMQFLNDRLASYLTR
..: .::: : :.:.. :. : :.:..:: ..:::::::: ::::::.:: .
CCDS11 SYRATSCLPAL-----CLPAGGFATSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 VRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDN
::::::::: :::::.: ..:: : :::::.::::::::.: ::.::::::.::.:::
CCDS11 VRQLEQENASLESRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 AKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKN
:::::::::.:::.:...:::::.::::::::::::::::.:::::::::::::.:::::
CCDS11 AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVESLKEELLCLKKN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 HEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEE
:::::.:::::::::::.::::::::::.:::::::::::..:: ::::.:.:.. : ::
CCDS11 HEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMRCQYETLVENNRRDAEDWLDTQSEE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 LNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQ
:::::..::::::. :..::.::::::.::::::::::.::.::.::.:.::::::::::
CCDS11 LNQQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHSMRDALESTLAETEARYSSQLAQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCS
::::::::::::::::::::::::::::::::::::: ::::::.:::.:: :::::::.
CCDS11 MQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA
360 370 380 390 400 410
420 430 440
pF1KE0 ---TPS--CTTCVPSP-CVP---RTVCVPRTVGMPCSPCPQGRY
.:: : :.:. : : :: : :: . : ::: ::.
CCDS11 PDYSPSKSCLPCLPAASCGPSAARTNCSPRPI---CVPCPGGRF
420 430 440 450
>>CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 (467 aa)
initn: 1930 init1: 1765 opt: 1885 Z-score: 1297.9 bits: 249.4 E(32554): 5.7e-66
Smith-Waterman score: 1896; 66.4% identity (82.9% similar) in 455 aa overlap (1-445:1-438)
10 20 30 40 50
pF1KE0 MTSSCCVTNNLQASLKS-C------PRPASVCSSGVNCR-PELC--LGYVCQPMACLPSV
:... :. . .:.:. : : .:. : : .:: : : ::. . . : ..
CCDS11 MATQTCTPTFSTGSIKGLCGTAGGISRVSSIRSVG-SCRVPSLAGAAGYISSARSGLSGL
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 CLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASY
.::: .:::: :.. :: .: :.:. ::.:::.:::::::::::::.:
CCDS11 --------GSCLPGSYLSSECHT----SGFVGSGGWFCEGSFNGSEKETMQFLNDRLANY
60 70 80 90 100
120 130 140 150 160 170
pF1KE0 LTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVN
: .:::::.::::::::::: . :. . :::::.:.:::..::::: ::.::::.:..
CCDS11 LEKVRQLERENAELESRIQEWYEFQIPYICPDYQSYFKTIEDFQQKILLTKSENARLVLQ
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE0 IDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCL
::::::::::::.:::.::..::::::::::::::::.::::::::::::::::::::::
CCDS11 IDNAKLAADDFRTKYETELSLRQLVEADINGLRRILDELTLCKADLEAQVESLKEELMCL
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE0 KKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQ
::::::::. ::::::::::.::::::::::...::.:::::::.:: :::::: ::: :
CCDS11 KKNHEEEVSVLRCQLGDRLNVEVDAAPPVDLNKILEDMRCQYEALVENNRRDVEAWFNTQ
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE0 MEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQ
:::::::..:::::: :..::.::::::.::::::::::.:.:::.::.:.:::::::
CCDS11 TEELNQQVVSSSEQLQCCQTEIIELRRTVNALEIELQAQHSMRNSLESTLAETEARYSSQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE0 LAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCN
::::::.:.::::::.::: :::::::::::::::.::::::: ::: :::.:::::: .
CCDS11 LAQMQCLISNVEAQLSEIRCDLERQNQEYQVLLDVKARLEGEIATYRHLLEGEDCKLPPQ
350 360 370 380 390 400
420 430 440
pF1KE0 PCSTPSCTTCVPSPCVPRTVCVPRTVGMPCSPCPQGRY
::.: .: . : :: . ::: ..::.: ::
CCDS11 PCAT-ACKPVIRVPSVPPVPCVP---SVPCTPAPQVGTQIRTITEEIRDGKVISSREHVQ
410 420 430 440 450 460
CCDS11 SRPL
>>CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 (416 aa)
initn: 1889 init1: 1763 opt: 1819 Z-score: 1253.7 bits: 241.1 E(32554): 1.6e-63
Smith-Waterman score: 1819; 69.1% identity (87.4% similar) in 405 aa overlap (46-447:6-407)
20 30 40 50 60 70
pF1KE0 KSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPASCLSKTYLSSSCQAAS
::::. :. :. . : . .:
CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHSCTLPGAC
10 20 30
80 90 100 110 120 130
pF1KE0 GISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQ
.: .... .:. ::.:::.:::::::::::::::: .:::::..:::::. :.: :..:
CCDS11 NIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRERSQQQ
40 50 60 70 80 90
140 150 160 170 180 190
pF1KE0 VLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLV
. :.:::.:.:::::::::::::.::::.::.::::::::::::.::..::..::::
CCDS11 EPLLCPSYQSYFKTIEELQQKILCTKSENARLVVQIDNAKLAADDFRTKYQTELSLRQLV
100 110 120 130 140 150
200 210 220 230 240 250
pF1KE0 EADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDA
:.::::::::::.:::::.:::::::::::::.:::.:::.::..::::::::::.::::
CCDS11 ESDINGLRRILDELTLCKSDLEAQVESLKEELLCLKSNHEQEVNTLRCQLGDRLNVEVDA
160 170 180 190 200 210
260 270 280 290 300 310
pF1KE0 APPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDL
:: :::.:::.: : ::::.::.:::.::.::. : ::::.::..::::::.::..::.:
CCDS11 APTVDLNRVLNETRSQYEALVETNRREVEQWFTTQTEELNKQVVSSSEQLQSYQAEIIEL
220 230 240 250 260 270
320 330 340 350 360 370
pF1KE0 RRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQ
:::::.:::::::::.::::::::::::::::::::.:.: .:::::.::::::.:::::
CCDS11 RRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRSDLERQ
280 290 300 310 320 330
380 390 400 410 420 430
pF1KE0 NQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPSCTTCVPSPCV--PRTVCVP
::::::::::::::: ::::::::::.:::.:: :::.: . . .::. : : :::
CCDS11 NQEYQVLLDVRARLECEINTYRSLLESEDCNLPSNPCATTNACSKPIGPCLSNPCTSCVP
340 350 360 370 380 390
440
pF1KE0 RTVGMPCSPC-PQGRY
. ::.:: :. :
CCDS11 PA---PCTPCAPRPRCGPCNSFVR
400 410
>>CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 (404 aa)
initn: 1770 init1: 1727 opt: 1754 Z-score: 1209.8 bits: 232.9 E(32554): 4.6e-61
Smith-Waterman score: 1754; 68.1% identity (86.1% similar) in 404 aa overlap (37-433:1-398)
10 20 30 40 50 60
pF1KE0 VTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQ-P-MACLPSVCLPTTFRPASCLSK
..: : : ..: : : : :: .
CCDS11 MSYSCGLPSLSCRTS-CSSRPCVPPSCHGC
10 20
70 80 90 100 110 120
pF1KE0 TYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAEL
: : ..:. ...:. .:. ::.:::.:::::::::::::::: .:::::..::::
CCDS11 T-LPGACNIPANVSNC----NWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAEL
30 40 50 60 70 80
130 140 150 160 170 180
pF1KE0 ESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAK
:. :.: :..: . .:::.:.:::::::::::.:.::::.::.:::::::.::::.:
CCDS11 ENLIRERSQQQEPLVCASYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLASDDFRTK
90 100 110 120 130 140
190 200 210 220 230 240
pF1KE0 YEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQ
::.::..:::::.::::::::::.::::..:::::::::::::.:::.:::.::..::::
CCDS11 YETELSLRQLVESDINGLRRILDELTLCRSDLEAQVESLKEELLCLKQNHEQEVNTLRCQ
150 160 170 180 190 200
250 260 270 280 290 300
pF1KE0 LGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQ
::::::.:::::: :::..::.: : ::::.::.:::.::.:: : ::::.::..::::
CCDS11 LGDRLNVEVDAAPTVDLNQVLNETRSQYEALVETNRREVEQWFATQTEELNKQVVSSSEQ
210 220 230 240 250 260
310 320 330 340 350 360
pF1KE0 LQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQ
::.::..::.::::::.:::::::::.::::::::::::::::::::.:.: .:::::.:
CCDS11 LQSYQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEARYSSQLSQVQRLITNVESQ
270 280 290 300 310 320
370 380 390 400 410
pF1KE0 LAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPS-CTT----
:::::.:::::::::::::::::::: ::::::::::.:::::: :::.: . :
CCDS11 LAEIRSDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACDKSTGP
330 340 350 360 370 380
420 430 440
pF1KE0 CVPSPCVPRTVCVPRTVGMPCSPCPQGRY
:. .:: :. : :
CCDS11 CISNPCGLRARCGPCNTFGY
390 400
>>CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 (404 aa)
initn: 1755 init1: 1697 opt: 1752 Z-score: 1208.5 bits: 232.7 E(32554): 5.4e-61
Smith-Waterman score: 1752; 68.1% identity (87.2% similar) in 398 aa overlap (47-433:1-398)
20 30 40 50 60 70
pF1KE0 SCPRPASVCSSGVNCRPELCLGYVCQPMACLP-SVCLPTTFRPASCLSKTYLSSSCQA--
.: . :::. .:: :. . ::..
CCDS11 MPYNFCLPSLSCRTSCSSRPCVPPSCHGYT
10 20 30
80 90 100 110 120 130
pF1KE0 ---ASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVRQLEQENAELESRIQE
: .: .... .:. ::.:::.:::::::::::::::: .:::::..:::::. :.:
CCDS11 LPGACNIPANVSNCNWFCEGSFNGSEKETMQFLNDRLASYLEKVRQLERDNAELENLIRE
40 50 60 70 80 90
140 150 160 170 180 190
pF1KE0 ASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAKLAADDFRAKYEAELA
:..: . :.:::.:.:::::::::::.:.::::.::.::::::::::::.::..: .
CCDS11 RSQQQEPLLCPSYQSYFKTIEELQQKILCSKSENARLVVQIDNAKLAADDFRTKYQTEQS
100 110 120 130 140 150
200 210 220 230 240 250
pF1KE0 MRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHEEEVGSLRCQLGDRLN
.:::::.:::.::::::.::::..:::::.:::::::. ::.:::.::..::::::::::
CCDS11 LRQLVESDINSLRRILDELTLCRSDLEAQMESLKEELLSLKQNHEQEVNTLRCQLGDRLN
160 170 180 190 200 210
260 270 280 290 300 310
pF1KE0 IEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELNQQVATSSEQLQNYQS
.:::::: :::..::.: : ::::.::.:::.::.:: : ::::.::..::::::.::.
CCDS11 VEVDAAPAVDLNQVLNETRNQYEALVETNRREVEQWFATQTEELNKQVVSSSEQLQSYQA
220 230 240 250 260 270
320 330 340 350 360 370
pF1KE0 DIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQCMITNVEAQLAEIRA
.::.::::::.:::::::::.:: :::::::::::::::::.:.: .:::::.::::::.
CCDS11 EIIELRRTVNALEIELQAQHNLRYSLENTLTESEARYSSQLSQVQSLITNVESQLAEIRS
280 290 300 310 320 330
380 390 400 410 420
pF1KE0 DLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTPS-CT----TCVPSPC
:::::::::::::::::::: ::::::::::.:::::: :::.: . : .:: .::
CCDS11 DLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPSNPCATTNACEKPIGSCVTNPC
340 350 360 370 380 390
430 440
pF1KE0 VPRTVCVPRTVGMPCSPCPQGRY
::. : :
CCDS11 GPRSRCGPCNTFGY
400
>>CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 (436 aa)
initn: 1710 init1: 1710 opt: 1731 Z-score: 1193.9 bits: 230.1 E(32554): 3.5e-60
Smith-Waterman score: 1731; 65.7% identity (83.8% similar) in 414 aa overlap (20-425:23-427)
10 20 30 40 50
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELC---LGYVCQPMACLPSV----
.:: . . ..: : ..: : ::::.
CCDS11 MLYAKPPPTINGIKGLQRKERLKPAHIHLQQLTCFSITCSSTMSYSC----CLPSLGCRT
10 20 30 40 50
60 70 80 90 100
pF1KE0 -CLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLAS
: : :: . : : ..:. ...:. .:. ::.:::.::::::::::::::
CCDS11 SCSSRPCVPPSCHGYT-LPGACNIPANVSNC----NWFCEGSFNGSEKETMQFLNDRLAS
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE0 YLTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVV
:: .:::::..:::::. ::: :..: . :.:::.:.:::::::::::.::::::.::
CCDS11 YLEKVRQLERDNAELEKLIQERSQQQEPLLCPSYQSYFKTIEELQQKILCAKAENARLVV
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE0 NIDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMC
::::::::.::::.::..: ..: :::.:::..:::::.:::::.:::.:::::.:::.:
CCDS11 NIDNAKLASDDFRSKYQTEQSLRLLVESDINSIRRILDELTLCKSDLESQVESLREELIC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE0 LKKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNM
:::::::::..:: :::::::.:::.:: :::..::.: : ::::.:: :::.::.::
CCDS11 LKKNHEEEVNTLRSQLGDRLNVEVDTAPTVDLNQVLNETRSQYEALVEINRREVEQWFAT
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE0 QMEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSS
: ::::.::..::::::. :..::.::::::.:::::::::.::::::::::::::.:::
CCDS11 QTEELNKQVVSSSEQLQSCQAEIIELRRTVNALEIELQAQHNLRDSLENTLTESEAHYSS
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE0 QLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPC
::.:.: .:::::.:::::: :::::::::::::::::::: ::::::::::.:::::::
CCDS11 QLSQVQSLITNVESQLAEIRCDLERQNQEYQVLLDVRARLECEINTYRSLLESEDCKLPC
360 370 380 390 400 410
410 420 430 440
pF1KE0 NPCSTPSCTTCVPSPCVPRTVCVPRTVGMPCSPCPQGRY
:::.: . . .::
CCDS11 NPCATTNASGNSCGPCGTSQKGCCN
420 430
>>CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 (431 aa)
initn: 1632 init1: 1468 opt: 1588 Z-score: 1097.0 bits: 212.1 E(32554): 8.7e-55
Smith-Waterman score: 1588; 57.9% identity (79.3% similar) in 439 aa overlap (1-431:1-424)
10 20 30 40 50 60
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRPELCLGYVCQPMACLPSVCLPTTFRPAS
:::.: :. : .:: :: :. . .: : .: : .: : : .: :
CCDS42 MTSDCSSTH---CSPESCGT-ASGCAPASSCSVET----ACLPGTCATSRCQTPSFLSRS
10 20 30 40 50
70 80 90 100 110
pF1KE0 -----CLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLTRVR
:: :...::.. . : .: .:.:..::::::::::::::::: .::
CCDS42 RGLTGCLLPCYFTGSCNSPCLV----GNCAWCEDGVFTSNEKETMQFLNDRLASYLEKVR
60 70 80 90 100
120 130 140 150 160 170
pF1KE0 QLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNIDNAK
.::. :::::::::: .... . :::: .: :::.::::::::::::.:..:..:: :
CCDS42 SLEETNAELESRIQEQCEQDIPMVCPDYQRYFNTIEDLQQKILCTKAENSRLAVQLDNCK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE0 LAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKKNHE
::.:::..:::.::..:::.::::..:. ::..:::::.::::.::::::.:.:::::::
CCDS42 LATDDFKSKYESELSLRQLLEADISSLHGILEELTLCKSDLEAHVESLKEDLLCLKKNHE
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE0 EEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQMEELN
:::. :: ::::::..:.:.:: .::.:::.::::: :... :::..:::. .: ::::
CCDS42 EEVNLLREQLGDRLSVELDTAPTLDLNRVLDEMRCQCETVLANNRREAEEWLAVQTEELN
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE0 QQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLAQMQ
:: .:.::::. : .:..:.::...::::::::.:: .::: :..:.::.:::::::.:
CCDS42 QQQLSSAEQLQGCQMEILELKRTASALEIELQAQQSLTESLECTVAETEAQYSSQLAQIQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE0 CMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPCSTP
:.: :.: :::::: :::::::::::::::.:::::::::: .::..:: .: :.::::
CCDS42 CLIDNLENQLAEIRCDLERQNQEYQVLLDVKARLEGEINTYWGLLDSEDSRLSCSPCST-
350 360 370 380 390 400
420 430 440
pF1KE0 SCT---TCVPSPCVPRTVCVPRTVGMPCSPCPQGRY
.:: :: :: ..:
CCDS42 TCTSSNTC--EPCSAYVICTVENCCL
410 420 430
>>CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 (491 aa)
initn: 1553 init1: 1434 opt: 1564 Z-score: 1080.1 bits: 209.2 E(32554): 7.7e-54
Smith-Waterman score: 1564; 56.6% identity (77.7% similar) in 452 aa overlap (2-443:3-442)
10 20 30 40 50
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVC--SSGVNCRPELCLGYVCQPMACLPSV-----CL
:..: .::. .. ..: : ..: ::. .:.: ::: . . . :
CCDS11 MDTKGCTTTNSPSTPCQNCSRITNVSTISSNNGCHPGGLTVNNCQPAGHVLRIPWDQGCQ
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 PTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKETMQFLNDRLASYLT
:: : : . :: .. .: :. :::.:: .:.:::::::.::.:::.::
CCDS11 PT---PRFCRKPIYLMNNFNA----RFSLDDCSWYGEG-INSNEKETMQILNERLANYLQ
70 80 90 100 110
120 130 140 150 160 170
pF1KE0 RVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILCTKAENARMVVNID
.::.::.:::::::.::: :.... .. ::: :.. ::::::::::::::::.:.: .::
CCDS11 KVRMLERENAELESKIQEESNKELPVLCPDYLSYYTTIEELQQKILCTKAENSRLVSQID
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 NAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQVESLKEELMCLKK
:.::.:::.:::::::...:::::.: :::..::. ::: ::::::::.::::::.:::.
CCDS11 NTKLTADDLRAKYEAEVSLRQLVESDANGLKQILNVLTLGKADLEAQVQSLKEELLCLKN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 NHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEANRRDVEEWFNMQME
::.::..::.::::.::.::: ::: .::..::.::::::: ..:.::.:::.::: :.:
CCDS11 NHKEEINSLQCQLGERLDIEVTAAPSADLNQVLQEMRCQYEPIMETNRKDVEQWFNTQIE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 ELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENTLTESEARYSSQLA
::::::.:::.: : :..::.:::.:::::.:::::: .::: : :::.::::.. :.
CCDS11 ELNQQVVTSSQQQQCCQKEIIELRRSVNTLEVELQAQHRMRDSQECILTETEARYTALLT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 QMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSLLENEDCKLPCNPC
:.: .: :.:::::::: ::::::::..::::..::: ::.:::::::. : : :: :
CCDS11 QIQSLIDNLEAQLAEIRCALERQNQEYEILLDVKSRLECEITTYRSLLESSDGKRPCYP-
360 370 380 390 400 410
420 430 440
pF1KE0 STPSCTTCVPSP---CVPRTVCVPRTVGMPCSPCPQGRY
: : ::: : .. . :::
CCDS11 ---RATKCEPSPWTSCKSGAIESTAPACTSSSPCSLKEHCSACGPLSRILVKICTITKEI
420 430 440 450 460
CCDS11 KDGKVISSYEHVQPCFIIRPAKV
470 480 490
>>CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 (456 aa)
initn: 1596 init1: 1430 opt: 1552 Z-score: 1072.4 bits: 207.6 E(32554): 2.1e-53
Smith-Waterman score: 1557; 55.6% identity (74.4% similar) in 464 aa overlap (2-446:6-453)
10 20 30 40
pF1KE0 MTSSCCVTNNLQASLKSCPRPASVCSSGVNCRP--ELCLGYVC-------------
.:: : : .. : .:: ..:.: : .. .:
CCDS11 MTSSYSSSSC---PLGCTMAPGARNVSVSPIDIGCQPGAEANIAPMCLLANVAHANRVRV
10 20 30 40 50
50 60 70 80 90
pF1KE0 --QPMACLPSVCLPTTFRPASCLSKTYLSSSCQAASGISGSMGPGSWYSEGAFNGNEKET
:.. ::.::: : : . : ..:. : :..: . :.:...::.::::
CCDS11 GSTPLG-RPSLCLPPT-----CHTACPLPGTCH----IPGNIGICGAYGENTLNGHEKET
60 70 80 90 100
100 110 120 130 140 150
pF1KE0 MQFLNDRLASYLTRVRQLEQENAELESRIQEASHSQVLTMTPDYQSHFRTIEELQQKILC
:::::::::.:: .::::::::::::. . : :. . :. :::::.:.:::::::::::
CCDS11 MQFLNDRLANYLEKVRQLEQENAELEATLLERSKCHESTVCPDYQSYFHTIEELQQKILC
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE0 TKAENARMVVNIDNAKLAADDFRAKYEAELAMRQLVEADINGLRRILDDLTLCKADLEAQ
.::::::..:.:::::::::::: : :.: ..::::::: : ...::: :: :::::::
CCDS11 SKAENARLIVQIDNAKLAADDFRIKLESERSLRQLVEADKCGTQKLLDDATLAKADLEAQ
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE0 VESLKEELMCLKKNHEEEVGSLRCQLGDRLNIEVDAAPPVDLTRVLEEMRCQYEAMVEAN
:::::: . ::.:::.:: :: :::..: ::.: : .::.::: ::: :::::.:.:
CCDS11 QESLKEEQLSLKSNHEQEVKILRSQLGEKLRIELDIEPTIDLNRVLGEMRAQYEAMLETN
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE0 RRDVEEWFNMQMEELNQQVATSSEQLQNYQSDIIDLRRTVNTLEIELQAQHSLRDSLENT
:.:::.::. : : .. : . ::.:: ::.:..:: :::.::.: ::::.:.: :.:.
CCDS11 RQDVEQWFQAQSEGISLQDMSCSEELQCCQSEILELRCTVNALEVERQAQHTLKDCLQNS
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE0 LTESEARYSSQLAQMQCMITNVEAQLAEIRADLERQNQEYQVLLDVRARLEGEINTYRSL
: :.: :....::::: .:.::: ::.:::::::::::::::::::..:::.:: :::.:
CCDS11 LCEAEDRFGTELAQMQSLISNVEEQLSEIRADLERQNQEYQVLLDVKTRLENEIATYRNL
350 360 370 380 390 400
400 410 420 430 440
pF1KE0 LENEDCKLPCNPCST-PSCTTCVPSPCVPRTVCVP-RTVGMPCSPCPQGRY
::.:::::::::::: :::.: .::.:: : : : : :. :
CCDS11 LESEDCKLPCNPCSTSPSCVT---APCAPRPSCGPCTTCGPTCGASTTGSRF
410 420 430 440 450
448 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 23:11:20 2016 done: Wed Nov 2 23:11:20 2016
Total Scan time: 2.410 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]