FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2705, 400 aa 1>>>pF1KE2705 400 - 400 aa - 400 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.7305+/-0.00121; mu= 1.3797+/- 0.072 mean_var=200.0291+/-39.774, 0's: 0 Z-trim(108.4): 90 B-trim: 67 in 1/50 Lambda= 0.090683 statistics sampled from 10077 (10167) to 10077 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.652), E-opt: 0.2 (0.312), width: 16 Scan time: 2.500 The best scores are: opt bits E(32554) CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 2520 342.5 4.2e-94 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 1638 227.1 2.4e-59 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 1586 220.3 2.9e-57 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 1573 218.6 9.5e-57 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 1562 217.2 2.5e-56 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 1524 212.2 7.9e-55 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 1523 212.0 8.1e-55 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1422 198.9 1e-50 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 1420 198.6 1e-50 CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 ( 525) 1322 185.8 7.9e-47 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 1309 184.1 2.4e-46 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 1242 175.3 1e-43 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 1229 173.7 4.2e-43 CCDS11373.1 KRT25 gene_id:147183|Hs108|chr17 ( 450) 1219 172.3 8e-43 CCDS11375.1 KRT27 gene_id:342574|Hs108|chr17 ( 459) 1217 172.0 9.7e-43 CCDS11376.1 KRT28 gene_id:162605|Hs108|chr17 ( 464) 1208 170.9 2.2e-42 CCDS11393.1 KRT32 gene_id:3882|Hs108|chr17 ( 448) 1207 170.7 2.4e-42 CCDS11388.1 KRT33A gene_id:3883|Hs108|chr17 ( 404) 1174 166.4 4.3e-41 CCDS11391.1 KRT31 gene_id:3881|Hs108|chr17 ( 416) 1174 166.4 4.5e-41 CCDS11389.1 KRT33B gene_id:3884|Hs108|chr17 ( 404) 1173 166.2 4.8e-41 CCDS11379.1 KRT20 gene_id:54474|Hs108|chr17 ( 424) 1168 165.6 7.8e-41 CCDS11390.1 KRT34 gene_id:3885|Hs108|chr17 ( 436) 1157 164.2 2.2e-40 CCDS11374.1 KRT26 gene_id:353288|Hs108|chr17 ( 468) 1156 164.1 2.5e-40 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 1113 158.4 1.2e-38 CCDS11380.1 KRT23 gene_id:25984|Hs108|chr17 ( 422) 1060 151.5 1.4e-36 CCDS42320.1 KRT40 gene_id:125115|Hs108|chr17 ( 431) 1052 150.4 2.9e-36 CCDS11382.1 KRT39 gene_id:390792|Hs108|chr17 ( 491) 1027 147.2 3.1e-35 CCDS11392.1 KRT38 gene_id:8687|Hs108|chr17 ( 456) 1024 146.8 3.9e-35 CCDS32653.1 KRT37 gene_id:8688|Hs108|chr17 ( 449) 1000 143.6 3.4e-34 CCDS62182.1 KRT23 gene_id:25984|Hs108|chr17 ( 285) 700 104.3 1.5e-22 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 644 97.1 3.7e-20 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 648 97.8 4.3e-20 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 634 95.8 9e-20 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 628 95.0 1.5e-19 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 628 95.0 1.5e-19 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 628 95.0 1.5e-19 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 624 94.5 2.4e-19 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 624 94.5 2.5e-19 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 586 89.5 7e-18 CCDS33859.1 BFSP2 gene_id:8419|Hs108|chr3 ( 415) 575 88.0 1.7e-17 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 571 87.5 2.8e-17 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 571 87.6 2.9e-17 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 570 87.5 3.8e-17 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 565 86.8 5.7e-17 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 563 86.5 6.4e-17 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 558 86.1 1.6e-16 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 549 84.7 2.3e-16 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 545 84.1 2.9e-16 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 545 84.1 3e-16 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 546 84.3 3.1e-16 >>CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 (400 aa) initn: 2520 init1: 2520 opt: 2520 Z-score: 1802.9 bits: 342.5 E(32554): 4.2e-94 Smith-Waterman score: 2520; 99.8% identity (100.0% similar) in 400 aa overlap (1-400:1-400) 10 20 30 40 50 60 pF1KE2 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSSGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS11 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSSGA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 YGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 YGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PGPSRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PGPSRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 ADINGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ADINGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 PGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 PGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 RTLQGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RTLQGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQN 310 320 330 340 350 360 370 380 390 400 pF1KE2 QEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL :::::::::::::::::::::::::::::::::::::::: CCDS11 QEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL 370 380 390 400 >>CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 (432 aa) initn: 1691 init1: 1588 opt: 1638 Z-score: 1178.8 bits: 227.1 E(32554): 2.4e-59 Smith-Waterman score: 1638; 66.7% identity (87.6% similar) in 396 aa overlap (1-390:1-394) 10 20 30 40 50 pF1KE2 MTSYSYRQSSATSSF---GGLGGGSVRFGPGVA--FRAPSIHGGS-GGRGVSVSSARFVS ::. : :: ...::. .:::::: : . .. . : : . :: :: : ..... . : CCDS11 MTT-SIRQFTSSSSIKGSSGLGGGSSRTSCRLSGGLGAGSCRLGSAGGLGSTLGGSSY-S 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 SSSSGGYGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRD : : : :::::. . . ::::::.:: :::::::::::::::::::: :: :::::::: CCDS11 SCYSFGSGGGYGSSFGGVDGLLAGGEKATMQNLNDRLASYLDKVRALEEANTELEVKIRD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 WYQKQGPGPSRDYSHYYTTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQA :::.:.:::.::::.:: ::..:..::: ::..:. :.:::::::::::::::::::::: CCDS11 WYQRQAPGPARDYSQYYRTIEELQNKILTATVDNANILLQIDNARLAADDFRTKFETEQA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 LRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVS ::.::::::::::::::::::::.:::::::.:::::::::::::::...:::::::... CCDS11 LRLSVEADINGLRRVLDELTLARADLEMQIENLKEELAYLKKNHEEEMNALRGQVGGEIN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 VEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRS ::.:.:::.::..::..::.::: :::.:::::: :: :.::::::::: ..: .: ..: CCDS11 VEMDAAPGVDLSRILNEMRDQYEKMAEKNRKDAEDWFFSKTEELNREVATNSELVQSGKS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 EVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRA :...::::.:.:::::::::::::.:: .::::: :. .::..::.::...: ::...: CCDS11 EISELRRTMQALEIELQSQLSMKASLEGNLAETENRYCVQLSQIQGLIGSVEEQLAQLRC 300 310 320 330 340 350 360 370 380 390 400 pF1KE2 DSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNLSASKVL . :.:::::. :.:.:.:::::::::: ::::.. : CCDS11 EMEQQNQEYKILLDVKTRLEQEIATYRRLLEGEDAHLTQYKKEPVTTRQVRTIVEEVQDG 360 370 380 390 400 410 CCDS11 KVISSREQVHQTTR 420 430 >>CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 (472 aa) initn: 1773 init1: 1522 opt: 1586 Z-score: 1141.5 bits: 220.3 E(32554): 2.9e-57 Smith-Waterman score: 1592; 61.6% identity (81.2% similar) in 432 aa overlap (7-398:6-430) 10 20 30 40 50 pF1KE2 MTSYSYRQSSATSSF-------GGLGGGSVRFGP---GVAFRAPSIHGGSGGRGVSVSSA :: ...::. ::.:::: :.. : . :::: .:: :.::::. CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGG----GLSVSSS 10 20 30 40 50 60 70 80 pF1KE2 RF---------------VSSSSS-------GGYGGG--------YGGVLTASDGLLAGNE :: ::::: :::::: .:: ....::::.:.: CCDS11 RFSSGGACGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGGFGGGFAGGDGLLVGSE 60 70 80 90 100 110 90 100 110 120 130 140 pF1KE2 KLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPSRDYSHYYTTIQDLRDK :.:::::::::::::::::::: ::..::::::::::.: :. .::: :. ::.:::.: CCDS11 KVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNK 120 130 140 150 160 170 150 160 170 180 190 200 pF1KE2 ILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDL :: ::..:. ..::::::::::::::::.::: :::::::::::::::::::::::.:: CCDS11 ILTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADL 180 190 200 210 220 230 210 220 230 240 250 260 pF1KE2 EMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMA :::::.:::::::::::::::...:::::::.:.::.:.:::.::..::..::.::: :: CCDS11 EMQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMA 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE2 EQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAAL :.:::::: :: ..::::::::: ..: .: ..::...::::.:.:::::::::::::.: CCDS11 EKNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASL 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE2 EDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATY :..: ::..:. :::.:: .:...: ::...: . :.:::::. :.:.:.::::::::: CCDS11 ENSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATY 360 370 380 390 400 410 390 400 pF1KE2 RSLLEGQEDHYNNLSASKVL : ::::.. : ::.:. CCDS11 RRLLEGEDAH---LSSSQFSSGSQSSRDVTSSSRQIRTKVMDVHDGKVVSTHEQVLRTKN 420 430 440 450 460 470 >>CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 (473 aa) initn: 1544 init1: 1544 opt: 1573 Z-score: 1132.3 bits: 218.6 E(32554): 9.5e-57 Smith-Waterman score: 1595; 60.8% identity (82.1% similar) in 429 aa overlap (7-397:6-434) 10 20 30 40 pF1KE2 MTSYSYRQSSATSSF-------GGLGGGSVRFGP---GVAFRAPSIHGGS---------- :: ...::. ::.:::: :.. : . :::: .::. CCDS11 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSG 10 20 30 40 50 50 60 70 80 pF1KE2 ------GGRGVSVSSARFVSSSSSGGYGGG------------YGGVLTASDGLLAGNEKL :: : . ::. .:. .:::::: .:: ....::::.:.::. CCDS11 GACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKV 60 70 80 90 100 110 90 100 110 120 130 140 pF1KE2 TMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPSRDYSHYYTTIQDLRDKIL :::::::::::::::::::: ::..::::::::::.: :. .::: :. ::.:::.::. CCDS11 TMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKII 120 130 140 150 160 170 150 160 170 180 190 200 pF1KE2 GATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEM .:::::.. .::::::::::::::::.: : :::..::::.::::::::::::::::::: CCDS11 AATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEM 180 190 200 210 220 230 210 220 230 240 250 260 pF1KE2 QIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQ ::::::::::::.::::::. .::::.::.:.::.:.:::.::..::..::.::: :::. CCDS11 QIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEK 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE2 NRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALED ::.:::.:: :.:::::.:::...: .: ::::::.:::.::::::::::::::::.::. CCDS11 NRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLEN 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE2 TLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRS .: ::..:. ::..::.::...: ::...: . :.:.:::: :.:.:.:::::::::: CCDS11 SLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRR 360 370 380 390 400 410 390 400 pF1KE2 LLEGQEDHYNNLSASKVL ::::.. : .. .:: CCDS11 LLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS 420 430 440 450 460 470 >>CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 (456 aa) initn: 1500 init1: 1227 opt: 1562 Z-score: 1124.7 bits: 217.2 E(32554): 2.5e-56 Smith-Waterman score: 1622; 63.5% identity (85.4% similar) in 417 aa overlap (1-388:1-414) 10 20 30 40 50 pF1KE2 MTSYSYRQSSATSSFGGLG--GGSVRFGPGVAFRAPSIHGGSGGRGVSVSSARFVSSSSS ::. .. :.: .:.::: . :::. : : .: . :. ::.:.:..:.::::::::.:. CCDS11 MTT-TFLQTS-SSTFGGGSTRGGSLLAGGG-GFGGGSLSGGGGSRSISASSARFVSSGSG 10 20 30 40 50 60 70 80 90 pF1KE2 GGYGGG-------------------------YGGVLTASDG-LLAGNEKLTMQNLNDRLA :::::: .:: . ..:: ::.::::.:::::::::: CCDS11 GGYGGGMRVCGFGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLLSGNEKITMQNLNDRLA 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE2 SYLDKVRALEAANGELEVKIRDWYQKQGP-GPSRDYSHYYTTIQDLRDKILGATIENSRI :::::::::: ::..:::::.:::::: : .: :::.:. ::..:::::...::.:::. CCDS11 SYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIEELRDKIMATTIDNSRV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 VLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEEL .:.:::::::::::: :.:.: :::..:::::::::::::::::::::::::::::.::: CCDS11 ILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTLARTDLEMQIEGLNEEL 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 AYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWF ::::::::::.. . .:..:::.::.:.:::.::...:..:: :::.:::.::.:.:::: CCDS11 AYLKKNHEEEMKEFSSQLAGQVNVEMDAAPGVDLTRVLAEMREQYEAMAEKNRRDVEAWF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 TSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARF :.:::::.:::..::..: :..:.::::::.: :::::::::::::.::..::::: :. CCDS11 FSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEIELQSQLSMKAGLENSLAETECRY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 GAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHY ..:: .::.::.:.::::...: . : :::::. :.:::.::::::::::::::::. CCDS11 ATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLDIKTRLEQEIATYRSLLEGQDAKM 360 370 380 390 400 410 400 pF1KE2 NNLSASKVL CCDS11 AGIAIREASSGGGGSSSNFHINVEESVDGQVVSSHKREI 420 430 440 450 >>CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 (458 aa) initn: 1495 init1: 1201 opt: 1524 Z-score: 1097.8 bits: 212.2 E(32554): 7.9e-55 Smith-Waterman score: 1540; 61.7% identity (82.3% similar) in 418 aa overlap (8-397:6-422) 10 20 30 40 50 pF1KE2 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPS---IHGGS-GGRGVSVSSARFVSSS :::..: ::.:::: ..: : . . : . ::: :: : .:: . : ... CCDS11 MSLRLQSSSASYGGGFGGGSCQLGGGRGVSTCSTRFVSGGSAGGYGGGVSCG-FGGGA 10 20 30 40 50 60 70 80 90 pF1KE2 SSG-------GYGGGYGGVLT---------------ASDG-LLAGNEKLTMQNLNDRLAS .:: : :::::: : : :: ::.::::.::::::::::: CCDS11 GSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGGLLTGNEKITMQNLNDRLAS 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE2 YLDKVRALEAANGELEVKIRDWYQKQGPG-PSRDYSHYYTTIQDLRDKILGATIENSRIV ::.:::::: ::..::::::::. ::.:. : :::: :: ::..:::::: :::::.:.. CCDS11 YLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTIEELRDKILTATIENNRVI 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 LQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEELA :.:::::::::::: :.:.: :::.::::::::::::::::::..::::::::.:.:::: CCDS11 LEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELTLSKTDLEMQIESLNEELA 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 YLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWFT :.:::::::.. . .:: :::.::.:..:: ::...:..:: :::.:::.::.::: :: CCDS11 YMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMREQYEAMAERNRRDAEEWFH 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 SRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARFG ... :::.::. .: ..: :..:.:.::::::::::::::::::::.::.:.:::: :.. CCDS11 TKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQLSMKAGLENTVAETECRYA 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 AQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHYN :: .::.:::.:::::...:.. : :::::. :.:::.::::::::::::::::. .. CCDS11 LQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLEQEIATYRSLLEGQDAKMI 360 370 380 390 400 410 400 pF1KE2 NLSASKVL .. .: CCDS11 GFPSSAGSVSPRSTSVTTTSSASVTTTSNASGRRTSDVRRP 420 430 440 450 >>CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 (420 aa) initn: 1495 init1: 1201 opt: 1523 Z-score: 1097.7 bits: 212.0 E(32554): 8.1e-55 Smith-Waterman score: 1539; 62.8% identity (82.6% similar) in 409 aa overlap (8-388:6-413) 10 20 30 40 50 pF1KE2 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPS---IHGGS-GGRGVSVSSARFVSSS :::..: ::.:::: ..: : . . : . ::: :: : .:: . : ... CCDS11 MSLRLQSSSASYGGGFGGGSCQLGGGRGVSTCSTRFVSGGSAGGYGGGVSCG-FGGGA 10 20 30 40 50 60 70 80 90 pF1KE2 SSG-------GYGGGYGGVLT---------------ASDG-LLAGNEKLTMQNLNDRLAS .:: : :::::: : : :: ::.::::.::::::::::: CCDS11 GSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGGLLTGNEKITMQNLNDRLAS 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE2 YLDKVRALEAANGELEVKIRDWYQKQGPG-PSRDYSHYYTTIQDLRDKILGATIENSRIV ::.:::::: ::..::::::::. ::.:. : :::: :: ::..:::::: :::::.:.. CCDS11 YLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKTIEELRDKILTATIENNRVI 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 LQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEELA :.:::::::::::: :.:.: :::.::::::::::::::::::..::::::::.:.:::: CCDS11 LEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDELTLSKTDLEMQIESLNEELA 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 YLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWFT :.:::::::.. . .:: :::.::.:..:: ::...:..:: :::.:::.::.::: :: CCDS11 YMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMREQYEAMAERNRRDAEEWFH 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 SRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARFG ... :::.::. .: ..: :..:.:.::::::::::::::::::::.::.:.:::: :.. CCDS11 TKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQLSMKAGLENTVAETECRYA 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 AQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHYN :: .::.:::.:::::...:.. : :::::. :.:::.::::::::::::::::. CCDS11 LQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRLEQEIATYRSLLEGQDAKKR 360 370 380 390 400 410 400 pF1KE2 NLSASKVL CCDS11 QPP 420 >>CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 (584 aa) initn: 1469 init1: 1088 opt: 1422 Z-score: 1024.2 bits: 198.9 E(32554): 1e-50 Smith-Waterman score: 1432; 60.7% identity (82.9% similar) in 387 aa overlap (5-387:84-456) 10 20 30 pF1KE2 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAP :.: : ..::::: :: :: : .: . CCDS11 GGSFSRGSSGGGCFGGSSGGYGGLGGFGGGSFRGSYGSSSFGGSYGGI--FGGG-SFGGG 60 70 80 90 100 110 40 50 60 70 80 90 pF1KE2 SIHGGS-GGRGVSVSSARFVSSSSSGGYGGGYGGVLTASDGLLAGNEKLTMQNLNDRLAS :. ::: :: : . .::.:::.:: . .. :::.::::.::::::::::: CCDS11 SFGGGSFGGGGFG-----------GGGFGGGFGGGFGGDGGLLSGNEKVTMQNLNDRLAS 120 130 140 150 100 110 120 130 140 150 pF1KE2 YLDKVRALEAANGELEVKIRDWYQKQG---PGPSRDYSHYYTTIQDLRDKILGATIENSR ::::::::: .: ::: ::..::.:.: : ::::.:: ::.::...::. : .:. CCDS11 YLDKVRALEESNYELEGKIKEWYEKHGNSHQGEPRDYSKYYKTIDDLKNQILNLTTDNAN 160 170 180 190 200 210 160 170 180 190 200 210 pF1KE2 IVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEE :.:::::::::::::: :.:.: :::.::::::::::::::::::...:::::::.: :: CCDS11 ILLQIDNARLAADDFRLKYENEVALRQSVEADINGLRRVLDELTLTKADLEMQIESLTEE 220 230 240 250 260 270 220 230 240 250 260 270 pF1KE2 LAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAW :::::::::::.. ::. :.:.::...:::.::...:..:::::: .::::::::::: CCDS11 LAYLKKNHEEEMKDLRNVSTGDVNVEMNAAPGVDLTQLLNNMRSQYEQLAEQNRKDAEAW 280 290 300 310 320 330 280 290 300 310 320 330 pF1KE2 FTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEAR :. ...::. :. .. ::.. .::.:.:::..:.:::::::::..: .:: .:::::.: CCDS11 FNEKSKELTTEIDNNIEQISSYKSEITELRRNVQALEIELQSQLALKQSLEASLAETEGR 340 350 360 370 380 390 340 350 360 370 380 390 pF1KE2 FGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDH . .::..::: ::..: :: ..::..: :: :::.:.::: :::.:: ::::::::. CCDS11 YCVQLSQIQAQISALEEQLQQIRAETECQNTEYQQLLDIKIRLENEIQTYRSLLEGEGSS 400 410 420 430 440 450 400 pF1KE2 YNNLSASKVL CCDS11 GGGGRGGGSFGGGYGGGSSGGGSSGGGHGGGHGGSSGGGYGGGSSGGGSSGGGYGGGSSS 460 470 480 490 500 510 >>CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 (494 aa) initn: 1364 init1: 1119 opt: 1420 Z-score: 1023.8 bits: 198.6 E(32554): 1e-50 Smith-Waterman score: 1437; 58.9% identity (81.5% similar) in 406 aa overlap (7-387:31-436) 10 20 30 pF1KE2 MTSYSYRQSSATSSFGGLGGGSVRFGP--GVAFRAP : ::.: .: ::.. :: : .: : CCDS11 MDLSNNTMSLSVRTPGLSRRLSSQSVIGRPRGMSASSVGSGYGGSAFGFGASCGGGFSAA 10 20 30 40 50 60 40 50 60 70 pF1KE2 SIHGGS----GGRGVSVSSA------RFVSSSSSGGYGGGYGG--------VLTASDG-L :. :.: :: : :.... : ....: :: : :.:: .:...:: : CCDS11 SMFGSSSGFGGGSGSSMAGGLGAGYGRALGGGSFGGLGMGFGGSPGGGSLGILSGNDGGL 70 80 90 100 110 120 80 90 100 110 120 130 pF1KE2 LAGNEKLTMQNLNDRLASYLDKVRALEAANGELEVKIRDWYQKQGPGPS----RDYSHYY :.:.:: :::::::::::::::::::: :: ::: :::.::. .: : . :::.:: CCDS11 LSGSEKETMQNLNDRLASYLDKVRALEEANTELENKIREWYETRGTGTADASQSDYSKYY 130 140 150 160 170 180 140 150 160 170 180 190 pF1KE2 TTIQDLRDKILGATIENSRIVLQIDNARLAADDFRTKFETEQALRMSVEADINGLRRVLD :.:::.::..:.: :....::::::::::.::: :.:.: :::..::::::::::::: CCDS11 PLIEDLRNKIISASIGNAQLLLQIDNARLAAEDFRMKYENELALRQGVEADINGLRRVLD 190 200 210 220 230 240 200 210 220 230 240 250 pF1KE2 ELTLARTDLEMQIEGLKEELAYLKKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSD ::::.:::::::::.:.:::::.:::::.:....: :.::::.:.:::.::...:.: CCDS11 ELTLTRTDLEMQIESLNEELAYMKKNHEDELQSFRVGGPGEVSVEMDAAPGVDLTRLLND 250 260 270 280 290 300 260 270 280 290 300 310 pF1KE2 MRSQYEVMAEQNRKDAEAWFTSRTEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQ ::.:::..:::::::::::: .. :: .:.. .::::: :.::::::::..:.:::::: CCDS11 MRAQYETIAEQNRKDAEAWFIEKSGELRKEISTNTEQLQSSKSEVTDLRRAFQNLEIELQ 310 320 330 340 350 360 320 330 340 350 360 370 pF1KE2 SQLSMKAALEDTLAETEARFGAQLAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKS :::.:: .:::.:::.:. . :::...: :::..:::: .::::.:::: ..:::...:. CCDS11 SQLAMKKSLEDSLAEAEGDYCAQLSQVQQLISNLEAQLLQVRADAERQNVDHQRLLNVKA 370 380 390 400 410 420 380 390 400 pF1KE2 RLEQEIATYRSLLEGQEDHYNNLSASKVL ::: :: ::: ::.:. CCDS11 RLELEIETYRRLLDGEAQGDGLEESLFVTDSKSQAQSTDSSKDPTKTRKIKTVVQEMVNG 430 440 450 460 470 480 >>CCDS11372.1 KRT24 gene_id:192666|Hs108|chr17 (525 aa) initn: 1239 init1: 1003 opt: 1322 Z-score: 954.2 bits: 185.8 E(32554): 7.9e-47 Smith-Waterman score: 1324; 56.4% identity (83.6% similar) in 383 aa overlap (16-387:75-452) 10 20 30 40 pF1KE2 MTSYSYRQSSATSSFGGLGGGSVRFGPGVAFRAPSIHGG-SG-GR ::.::.: : :..: . : :: :: :: CCDS11 GGASSCSLSGGSSGAFGGSFGGGFGSCSVGGGFGGAS---GSGTGFGGGSSFGGVSGFGR 50 60 70 80 90 100 50 60 70 80 90 pF1KE2 GVSV-SSARFVSSSSSGG---YGGGYGGVLTASDGLLAGNEKLTMQNLNDRLASYLDKVR : . .:.:: ::...:: ::::.:: . .. ::..:.:: ::::::::::.:::::: CCDS11 GSGFCGSSRF-SSGATGGFYSYGGGMGGGV-GDGGLFSGGEKQTMQNLNDRLANYLDKVR 110 120 130 140 150 100 110 120 130 140 150 pF1KE2 ALEAANGELEVKIRDWYQKQGPGPS-----RDYSHYYTTIQDLRDKILGATIENSRIVLQ ::: :: .:: ::..::.: ::: . ::::.::. :.:::..:..::.::. :.:. CCDS11 ALEEANTDLENKIKEWYDKYGPGSGDGGSGRDYSKYYSIIEDLRNQIIAATVENAGIILH 160 170 180 190 200 210 160 170 180 190 200 210 pF1KE2 IDNARLAADDFRTKFETEQALRMSVEADINGLRRVLDELTLARTDLEMQIEGLKEELAYL :::::::::::: :.:.: ::.::::::::::.:::.::..:.:::::::.. :::::: CCDS11 IDNARLAADDFRLKYENELCLRQSVEADINGLRKVLDDLTMTRSDLEMQIESFTEELAYL 220 230 240 250 260 270 220 230 240 250 260 270 pF1KE2 KKNHEEEISTLRGQVGGQVSVEVDSAPGTDLAKILSDMRSQYEVMAEQNRKDAEAWFTSR .::::::.....:. ::.:.::...::::::.:.:.:::.::: .:::::..:: :... CCDS11 RKNHEEEMKNMQGSSGGEVTVEMNAAPGTDLTKLLNDMRAQYEELAEQNRREAEERFNKQ 280 290 300 310 320 330 280 290 300 310 320 330 pF1KE2 TEELNREVAGHTEQLQMSRSEVTDLRRTLQGLEIELQSQLSMKAALEDTLAETEARFGAQ . :. ... . ...:.:.:.::::.:::::::::.::..:: :::.::: . :: CCDS11 SASLQAQISTDAGAATSAKNEITELKRTLQALEIELQSQLAMKSSLEGTLADTEAGYVAQ 340 350 360 370 380 390 340 350 360 370 380 390 pF1KE2 LAHIQALISGIEAQLGDVRADSERQNQEYQRLMDIKSRLEQEIATYRSLLEGQEDHYNNL :..::. ::..: .. .. .... :: ::..:.:::.::: :: ::: ::.:. CCDS11 LSEIQTQISALEEEICQIWGETKCQNAEYKQLLDIKTRLEVEIETYRRLLDGEGGGSSFA 400 410 420 430 440 450 400 pF1KE2 SASKVL CCDS11 EFGGRNSGSVNMGSRDLVSGDSRSGSCSGQGRDSSKTRVTKTIVEELVDGKVVSSQVSSI 460 470 480 490 500 510 400 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Sep 21 11:31:05 2017 done: Thu Sep 21 11:31:06 2017 Total Scan time: 2.500 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]