FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4453, 473 aa 1>>>pF1KE4453 473 - 473 aa - 473 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.1806+/-0.00139; mu= 2.0084+/- 0.084 mean_var=301.4740+/-60.165, 0's: 0 Z-trim(110.1): 126 B-trim: 99 in 1/50 Lambda= 0.073867 statistics sampled from 11240 (11362) to 11240 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.673), E-opt: 0.2 (0.349), width: 16 Scan time: 3.470 The best scores are: opt bits E(32554) CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 3032 337.0 2.6e-92 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 2569 287.7 1.9e-77 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1845 210.5 3.1e-54 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1843 210.2 3.4e-54 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1803 206.0 6.8e-53 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1770 202.5 7.4e-52 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1640 188.8 1.4e-47 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 1565 180.6 2.7e-45 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1557 179.8 5.6e-45 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 1465 170.1 5.8e-42 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1432 166.5 6e-41 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1383 161.3 2e-39 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1350 157.7 2.3e-38 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 1343 157.0 3.8e-38 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1340 156.7 4.9e-38 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 1311 153.6 4.2e-37 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1279 150.2 4.4e-36 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1222 144.0 2.8e-34 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1213 143.1 5.3e-34 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1206 142.3 8.9e-34 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1205 142.2 9.9e-34 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1190 140.7 3.1e-33 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1181 139.7 5.9e-33 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 1110 132.1 1.1e-30 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1086 129.6 6.6e-30 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 1046 125.3 1.2e-28 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1036 124.3 2.7e-28 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1027 123.3 5.6e-28 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1016 122.1 1.2e-27 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 765 95.2 9.8e-20 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 681 86.6 8.4e-17 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 672 85.8 2.1e-16 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 657 83.9 3.8e-16 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 655 83.6 4.4e-16 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 653 83.4 5.1e-16 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 654 83.6 5.6e-16 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 653 83.5 5.6e-16 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 647 82.9 9.3e-16 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 638 81.9 1.7e-15 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 638 81.9 1.7e-15 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 633 81.3 2.4e-15 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 632 81.3 3e-15 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 630 81.1 3.3e-15 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 629 81.0 3.6e-15 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 627 80.7 3.7e-15 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 625 80.6 4.8e-15 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 615 79.6 1.1e-14 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 596 77.4 3.6e-14 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 593 77.1 4.8e-14 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 593 77.1 4.9e-14 >>CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 (473 aa) initn: 3032 init1: 3032 opt: 3032 Z-score: 1770.7 bits: 337.0 E(32554): 2.6e-92 Smith-Waterman score: 3032; 100.0% identity (100.0% similar) in 473 aa overlap (1-473:1-473) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKVT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 MQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKIIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKIIA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 ATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEMQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEMQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 IEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEKN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 RRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLENS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLENS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRRL 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 LEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS 430 440 450 460 470 >>CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 (472 aa) initn: 2065 init1: 2065 opt: 2569 Z-score: 1504.1 bits: 287.7 E(32554): 1.9e-77 Smith-Waterman score: 2569; 87.6% identity (95.4% similar) in 458 aa overlap (1-456:1-449) 10 20 30 40 50 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSS-RFSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::: CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 GACGLGGGYGGGFSSSSS-FGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEK :::::::::::::::::: ::::::::::::::::.::: ::::::::::::::::: CCDS11 GACGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGG----FGGGFAGGDGLLVGSEK 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 VTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKI ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS11 VTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 IAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLE ..::..::. .:::::::::::::::::: :: ::..::::.::::::::::::::.::: CCDS11 LTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADLE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 MQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAE ::::.::::::::.::::::: :::::.::::::::::::::::::::::::::::.::: CCDS11 MQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 KNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLE :::.::: ::..::::::.:::.:::::::..::..::::..:.:::::::::::::::: CCDS11 KNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 NSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYR ::::::::::::::.::: .::::::::::::::::::.:::.::::::::::::::::: CCDS11 NSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 RLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS ::::::::::::.: :. : :::.: .::::: : CCDS11 RLLEGEDAHLSSSQFSSGSQSSRDV-----TSSSRQIRTKVMDVHDGKVVSTHEQVLRTK 420 430 440 450 460 470 CCDS11 N >>CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 (456 aa) initn: 1786 init1: 1368 opt: 1845 Z-score: 1087.3 bits: 210.5 E(32554): 3.1e-54 Smith-Waterman score: 1845; 69.2% identity (86.9% similar) in 428 aa overlap (25-440:14-433) 10 20 30 40 50 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGG-----LSVSS- ::::.: .:.::::. . .. .:: .:.:: CCDS11 MTTTFLQTSSSTFGGGSTRGGSLLAGGGGFGGGSLSGGGGSRSISASSA 10 20 30 40 60 70 80 90 100 110 pF1KE4 RFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDG-LL :: :.:. :::::::. ::::: :. .:.:::::.:.::::::.:::: :: CCDS11 RFVSSGS---GGGYGGGMRVC-----GFGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 VGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIK-DYSPYFKTIE :.::.::::::::::::::::::::::::::::::.::::.: :. . ::: :::::: CCDS11 SGNEKITMQNLNDRLASYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTL .::.::.:.::.:.. ::.:::::::::::: :::.:::::: ::::.:::::::::::: CCDS11 ELRDKIMATTIDNSRVILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 ARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQ ::::::::::::.::::::.::::::: . .: .:.:::::::::::::.:.: :::.: CCDS11 ARTDLEMQIEGLNEELAYLKKNHEEEMKEFSSQLAGQVNVEMDAAPGVDLTRVLAEMREQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 YEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLS :: ::::::::.:.::.:::::::::::::.:..:.:..:.:.:::..: :::::::::: CCDS11 YEAMAEKNRRDVEAWFFSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEIELQSQLS 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 MKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQ :::.::::: ::. :: ::.:::::::..: ::..:::::: :.:::..:::.:::::: CCDS11 MKAGLENSLAETECRYATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLDIKTRLEQ 350 360 370 380 390 400 420 430 440 450 460 pF1KE4 EIATYRRLLEGEDAHLSS----QQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFS :::::: ::::.::.... . .:: . :: CCDS11 EIATYRSLLEGQDAKMAGIAIREASSGGGGSSSNFHINVEESVDGQVVSSHKREI 410 420 430 440 450 470 pF1KE4 QGQSS >>CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 (432 aa) initn: 2010 init1: 1803 opt: 1843 Z-score: 1086.4 bits: 210.2 E(32554): 3.4e-54 Smith-Waterman score: 1904; 70.2% identity (84.8% similar) in 446 aa overlap (1-445:1-410) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG ::: ::::::::.::: :.::: . : :.:. :..:::: :. CCDS11 MTTSIRQFTSSSSIKGSSGLGGGSSRTSCRLSGGLGAGSCRL----------------GS 10 20 30 40 70 80 90 100 110 pF1KE4 ACGLGGGYGGG-FSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKV : :::. ::. .:: ::::: ::::...: : ::::.:.::. CCDS11 AGGLGSTLGGSSYSSCYSFGSG--GGYGSSFG----------------GVDGLLAGGEKA 50 60 70 80 120 130 140 150 160 170 pF1KE4 TMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKII :::::::::::::::::::::::..:::::::::::: :. .::: :..:::.:.:::. CCDS11 TMQNLNDRLASYLDKVRALEEANTELEVKIRDWYQRQAPGPARDYSQYYRTIEELQNKIL 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE4 AATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEM .::..::. .::::::::::::::::.: : ::: .::::.::::::::::::::.:::: CCDS11 TATVDNANILLQIDNARLAADDFRTKFETEQALRLSVEADINGLRRVLDELTLARADLEM 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE4 QIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEK :::.::::::::.::::::: :::::.::..::::::::::::::::::::::::.:::: CCDS11 QIENLKEELAYLKKNHEEEMNALRGQVGGEINVEMDAAPGVDLSRILNEMRDQYEKMAEK 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE4 NRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLEN ::.::: ::.:::::::.:::.:::::::..::..::::..:.::::::::::::::::. CCDS11 NRKDAEDWFFSKTEELNREVATNSELVQSGKSEISELRRTMQALEIELQSQLSMKASLEG 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 SLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRR .: ::..:::.::::::::::::::::::::::::::.:::.:::::::::::::::::: CCDS11 NLAETENRYCVQLSQIQGLIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRR 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE4 LLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS :::::::::. : . . ..:.: : CCDS11 LLEGEDAHLT--QYKKEPVTTRQVRTIVEEVQDGKVISSREQVHQTTR 390 400 410 420 430 >>CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 (458 aa) initn: 1723 init1: 1300 opt: 1803 Z-score: 1063.1 bits: 206.0 E(32554): 6.8e-53 Smith-Waterman score: 1841; 65.7% identity (84.6% similar) in 449 aa overlap (17-455:9-443) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG : . :::.:::: . :.:: :. :: :.:: ::: CCDS11 MSLRLQSSSASYGGGFGGGSCQ----LGGG--RGVST------CSTRFVSGG 10 20 30 40 70 80 90 100 110 pF1KE4 -ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGG--------DG : : ::: . ::.... :::::::::::::.:.:::::.::::::::: : CCDS11 SAGGYGGGVSCGFGGGA--GSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGG 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 LLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRP-SEIKDYSPYFKT ::.:.::.:::::::::::::.:::::::::::::::::::. .: : : .:::::.:: CCDS11 LLTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 IEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDEL ::.::.::..::::: . ::.:::::::::::: :::.::::::.::::.:::::::::: CCDS11 IEELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDEL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 TLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMR ::..::::::::.:.:::::..::::::: . .:. :.:::::::.::.::.:.: ::: CCDS11 TLSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMR 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 DQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQ .::: :::.:::::: :: .:. ::::::..:. ..:.:..:.:::::.::::::::::: CCDS11 EQYEAMAERNRRDAEEWFHTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQ 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 LSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRL :::::.:::.. ::. :: .::.::::::.:.: ::..:: ::: :.:::..:::.:::: CCDS11 LSMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 EQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQG :::::::: ::::.::.. . .:. : : : . ....::.: : CCDS11 EQEIATYRSLLEGQDAKMIGFPSSAGSVSPRSTSVTTTSSASVTTTSNASGRRTSDVRRP 400 410 420 430 440 450 pF1KE4 QSS >>CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 (420 aa) initn: 1476 init1: 1267 opt: 1770 Z-score: 1044.5 bits: 202.5 E(32554): 7.4e-52 Smith-Waterman score: 1808; 68.3% identity (86.0% similar) in 420 aa overlap (17-426:9-414) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG : . :::.:::: . :.:: :. :: :.:: ::: CCDS11 MSLRLQSSSASYGGGFGGGSCQ----LGGG--RGVST------CSTRFVSGG 10 20 30 40 70 80 90 100 110 pF1KE4 -ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGG--------DG : : ::: . ::.... :::::::::::::.:.:::::.::::::::: : CCDS11 SAGGYGGGVSCGFGGGA--GSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGG 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 LLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRP-SEIKDYSPYFKT ::.:.::.:::::::::::::.:::::::::::::::::::. .: : : .:::::.:: CCDS11 LLTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 IEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDEL ::.::.::..::::: . ::.:::::::::::: :::.::::::.::::.:::::::::: CCDS11 IEELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDEL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 TLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMR ::..::::::::.:.:::::..::::::: . .:. :.:::::::.::.::.:.: ::: CCDS11 TLSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMR 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 DQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQ .::: :::.:::::: :: .:. ::::::..:. ..:.:..:.:::::.::::::::::: CCDS11 EQYEAMAERNRRDAEEWFHTKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQ 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 LSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRL :::::.:::.. ::. :: .::.::::::.:.: ::..:: ::: :.:::..:::.:::: CCDS11 LSMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 EQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQG :::::::: ::::.:: CCDS11 EQEIATYRSLLEGQDAKKRQPP 400 410 420 >>CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 (584 aa) initn: 1317 init1: 1157 opt: 1640 Z-score: 967.9 bits: 188.8 E(32554): 1.4e-47 Smith-Waterman score: 1640; 60.8% identity (81.6% similar) in 452 aa overlap (12-452:37-483) 10 20 30 pF1KE4 MTTCSRQFTSSSSMKGSCGIG---GGIGGGS-SRISSVLAG :: ::: : : ::..::: :: :: : CCDS11 SSKHYSSSRSGGGGGGGGCGGGGGVSSLRISSSKGSLGGGFSSGGFSGGSFSRGSS---G 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 GSCRAPST--YGG--GLSVSSRFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAG :.: . :. ::: :.. .: .: :. ..::.::: :...: :..:::: :: : : CCDS11 GGCFGGSSGGYGGLGGFGGGSFRGSYGSSSFGGSYGGIFGGGSFGGGSFGGGSFGGGGFG 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 FGGGLGAGFGGGFAGGDGLLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWY :::.:.::::::.: ::: :.::::::::::::::::::::::::.: .:: ::..:: CCDS11 -GGGFGGGFGGGFGGDGGLLSGNEKVTMQNLNDRLASYLDKVRALEESNYELEGKIKEWY 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE4 QRQRPS---EIKDYSPYFKTIEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHEL ... : : .::: :.:::.::.:.:. : .::. .:::::::::::::: :::.:. CCDS11 EKHGNSHQGEPRDYSKYYKTIDDLKNQILNLTTDNANILLQIDNARLAADDFRLKYENEV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE4 ALRQTVEADVNGLRRVLDELTLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDV ::::.::::.::::::::::::...:::::::.: ::::::.::::::: ::. . ::: CCDS11 ALRQSVEADINGLRRVLDELTLTKADLEMQIESLTEELAYLKKNHEEEMKDLRNVSTGDV 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE4 NVEMDAAPGVDLSRILNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSR ::::.:::::::...::.::.::::.::.::.:::.:: :..::. :. .: : ..: . CCDS11 NVEMNAAPGVDLTQLLNNMRSQYEQLAEQNRKDAEAWFNEKSKELTTEIDNNIEQISSYK 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE4 SEVTELRRVLQGLEIELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLR ::.::::: .:.:::::::::..: ::: :: ::.::::.::::::. :...:::: :.: CCDS11 SEITELRRNVQALEIELQSQLALKQSLEASLAETEGRYCVQLSQIQAQISALEEQLQQIR 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE4 CEMEQQSQEYQILLDVKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSS : : :. ::: :::.: :::.:: ::: ::::: . .. ...: :... ::... CCDS11 AETECQNTEYQQLLDIKIRLENEIQTYRSLLEGEGSSGGGGRGGG-SFGGGYGGGSSGGG 430 440 450 460 470 480 460 470 pF1KE4 SSRQTRPILKEQSSSSFSQGQSS :: CCDS11 SSGGGHGGGHGGSSGGGYGGGSSGGGSSGGGYGGGSSSGGHGGSSSGGYGGGSSGGGGGG 490 500 510 520 530 540 >>CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 (400 aa) initn: 1575 init1: 1536 opt: 1565 Z-score: 926.7 bits: 180.6 E(32554): 2.7e-45 Smith-Waterman score: 1591; 60.5% identity (81.8% similar) in 435 aa overlap (1-434:1-397) 10 20 30 40 50 pF1KE4 MTTCS-RQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSG ::. : :: ...::. ::.:::: :.. : . :::: .::. CCDS11 MTSYSYRQSSATSSF-------GGLGGGSVRFG---PGVAFRAPSIHGGS---------- 10 20 30 40 60 70 80 90 100 110 pF1KE4 GACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKV :: : . ::. .:. .:.:::: .:: ....::::.:.::. CCDS11 ------GGRGVSVSSARFVSSSSSGAYGGG------------YGGVLTASDGLLAGNEKL 50 60 70 80 120 130 140 150 160 170 pF1KE4 TMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKII :::::::::::::::::::: ::..::::::::::.: :. .::: :. ::.:::.::. CCDS11 TMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPSRDYSHYYTTIQDLRDKIL 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE4 AATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEM .:::::.. .::::::::::::::::.: : :::..::::.::::::::::::::::::: CCDS11 GATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEM 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE4 QIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEK ::::::::::::.::::::. .::::.::.:.::.:.:::.::..::..::.::: :::. CCDS11 QIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQ 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE4 NRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLEN ::.:::.:: :.:::::.:::...: .: ::::::.:::.::::::::::::::::.::. CCDS11 NRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALED 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 SLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRR .: ::..:. ::..::.::...: ::...: . :.:.:::: :.:.:.:::::::::: CCDS11 TLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRS 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE4 LLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS ::::.. : .. .:: CCDS11 LLEGQEDHYNNLSASKVL 390 400 >>CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 (494 aa) initn: 1170 init1: 1170 opt: 1557 Z-score: 921.0 bits: 179.8 E(32554): 5.6e-45 Smith-Waterman score: 1557; 56.2% identity (79.6% similar) in 466 aa overlap (5-458:18-470) 10 20 30 40 pF1KE4 MTTCSRQFTSSSSM---KG--SCGIGGGIGGGSSRISSVLAGGSCRA ::...:.: . .: . ..:.: :: :. :.:: CCDS11 MDLSNNTMSLSVRTPGLSRRLSSQSVIGRPRGMSASSVGSGYGG-----SAFGFGASC-- 10 20 30 40 50 50 60 70 80 90 100 pF1KE4 PSTYGGGLSVSSRFSSGGACGLGGGYGGGFSSS--SSFGSGFGGGYGGGLGAGFGGGLGA :::.:..: : :.. :.::: :...... ...: ..::: :::: ::::. :. CCDS11 ----GGGFSAASMF--GSSSGFGGGSGSSMAGGLGAGYGRALGGGSFGGLGMGFGGSPGG 60 70 80 90 100 110 120 130 140 150 pF1KE4 GFGGGFAGGDG-LLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPS : : ..:.:: :: :::: :::::::::::::::::::::::..:: :::.::. . . CCDS11 GSLGILSGNDGGLLSGSEKETMQNLNDRLASYLDKVRALEEANTELENKIREWYETRGTG 110 120 130 140 150 160 160 170 180 190 200 210 pF1KE4 EI----KDYSPYFKTIEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQT .::: :. :::::::::.:.: ::: .::::::::::.::: :::.:::::: CCDS11 TADASQSDYSKYYPLIEDLRNKIISASIGNAQLLLQIDNARLAAEDFRMKYENELALRQG 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE4 VEADVNGLRRVLDELTLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMD ::::.::::::::::::.:::::::::.:.:::::..::::.:. ..: :.:.:::: CCDS11 VEADINGLRRVLDELTLTRTDLEMQIESLNEELAYMKKNHEDELQSFRVGGPGEVSVEMD 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE4 AAPGVDLSRILNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTE :::::::.:.::.:: ::: .::.::.:::.::. :. :: ::...:.: .:::.::::. CCDS11 AAPGVDLTRLLNDMRAQYETIAEQNRKDAEAWFIEKSGELRKEISTNTEQLQSSKSEVTD 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 LRRVLQGLEIELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQ :::..:.:::::::::.:: :::.:: :..: :: ::::.: ::...: :: :.: . :. CCDS11 LRRAFQNLEIELQSQLAMKKSLEDSLAEAEGDYCAQLSQVQQLISNLEAQLLQVRADAER 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE4 QSQEYQILLDVKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQT :. ..: ::.::.::: :: ::::::.:: . ... . :. .. ...::.. .: CCDS11 QNVDHQRLLNVKARLELEIETYRRLLDGEAQGDGLEESLFVTDSKSQAQSTDSSKDPTKT 410 420 430 440 450 460 460 470 pF1KE4 RPILKEQSSSSFSQGQSS : : CCDS11 RKIKTVVQEMVNGEVVSSQVQEIEELM 470 480 490 >>CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 (623 aa) initn: 1058 init1: 1058 opt: 1465 Z-score: 866.8 bits: 170.1 E(32554): 5.8e-42 Smith-Waterman score: 1472; 51.4% identity (78.0% similar) in 481 aa overlap (6-472:29-502) 10 20 30 pF1KE4 MTTCSRQFTSSSSMKGSCGIGG------GIGGGSSRI :. : : .:. : :: : ::::::. CCDS32 MSCRQFSSSYLSRSGGGGGGGLGSGGSIRSSYSRFSSSGGGGGGGRFSSSSGYGGGSSRV 10 20 30 40 50 60 40 50 60 70 80 pF1KE4 SSVLAGGSC--RAPSTYGGGLSVSSRFSS--GGACGLGGGYGGGFSSSSSFGSGFGGGYG . .::: . :::.:.:: .. ::. :.::. :::.:::..::.::::: : CCDS32 CGRGGGGSFGYSYGGGSGGGFSASSLGGGFGGGSRGFGGASGGGYSSSGGFGGGFGGGSG 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE4 GGLGAGFGGGLGA--GFGGGFAGGDG-LLVGSEKVTMQNLNDRLASYLDKVRALEEANAD ::.:.:.:.:.:. ::::: .:::: .:...:: :::.::.:::::::::.:::::: : CCDS32 GGFGGGYGSGFGGFGGFGGGAGGGDGGILTANEKSTMQELNSRLASYLDKVQALEEANND 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE4 LEVKIRDWYQRQRPSEI-KDYSPYFKTIEDLRNKIIAATIENAQPILQIDNARLAADDFR :: ::.:::... :. : :.::::..::.::...:. :. : . .:.:::.:.. :::: CCDS32 LENKIQDWYDKKGPAAIQKNYSPYYNTIDDLKDQIVDLTVGNNKTLLDIDNTRMTLDDFR 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE4 TKYEHELALRQTVEADVNGLRRVLDELTLARTDLEMQIEGLKEELAYLRKNHEEEMLALR :.: : ::: :.::.::::.:::.::. ..::::: : :.::: :.:::.::: : CCDS32 IKFEMEQNLRQGVDADINGLRQVLDNLTMEKSDLEMQYETLQEELMALKKNHKEEMSQLT 250 260 270 280 290 300 270 280 290 300 310 320 pF1KE4 GQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNS ::..::::::...::: ::.. ::.::..:::. :::.: :. . .. ....::.:.. CCDS32 GQNSGDVNVEINVAPGKDLTKTLNDMRQEYEQLIAKNRKDIENQYETQITQIEHEVSSSG 310 320 330 340 350 360 330 340 350 360 370 380 pF1KE4 ELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVE . :::: .:::.::. .: :::::::::: ::.::.:::.::.::: ::..:: :...: CCDS32 QEVQSSAKEVTQLRHGVQELEIELQSQLSKKAALEKSLEDTKNRYCGQLQMIQEQISNLE 370 380 390 400 410 420 390 400 410 420 430 440 pF1KE4 EQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREV :....: :.: :.:::..::..: :::.:: ::. :::: . . :. :. . ..: CCDS32 AQITDVRQEIECQNQEYSLLLSIKMRLEKEIETYHNLLEGGQEDFESSGAGKIGLGGR-- 430 440 450 460 470 450 460 470 pF1KE4 FTSSSSSSSRQTRPILKEQSSSSFSQGQSS .:..: .: .: :..:.. : : CCDS32 -GGSGGSYGRGSRG----GSGGSYGGGGSGGGYGGGSGSRGGSGGSYGGGSGSGGGSGGG 480 490 500 510 520 530 473 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:01:45 2016 done: Sun Nov 6 01:01:46 2016 Total Scan time: 3.470 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]