FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6743, 628 aa 1>>>pF1KE6743 628 - 628 aa - 628 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.4772+/-0.00156; mu= -2.5271+/- 0.094 mean_var=436.4560+/-85.969, 0's: 0 Z-trim(110.2): 150 B-trim: 0 in 0/54 Lambda= 0.061391 statistics sampled from 11307 (11444) to 11307 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.352), width: 16 Scan time: 3.530 The best scores are: opt bits E(32554) CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 4128 380.8 3e-105 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 2559 241.8 2.1e-63 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 2280 217.1 5.4e-56 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 2257 215.1 2.3e-55 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 2257 215.1 2.4e-55 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 2169 207.2 4.8e-53 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 2167 207.0 5.4e-53 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 2157 206.2 1e-52 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 2034 195.2 1.8e-49 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 1975 190.1 7.2e-48 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1931 186.1 1e-46 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1886 182.1 1.6e-45 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1820 176.3 9.4e-44 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1818 176.1 1e-43 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1745 169.6 9.3e-42 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1723 167.7 3.5e-41 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1653 161.4 2.5e-39 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1653 161.5 2.6e-39 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 1615 158.1 2.5e-38 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1534 150.9 3.9e-36 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1533 150.9 4.5e-36 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1389 138.1 2.8e-32 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1370 136.4 9e-32 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1351 134.7 2.8e-31 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1342 133.9 5.1e-31 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1341 133.8 5.2e-31 CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1244 125.1 1.8e-28 CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 1146 116.5 8e-26 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1053 108.3 2.4e-23 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 1051 108.1 2.6e-23 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1033 106.6 9.5e-23 CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 858 90.8 2.8e-18 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 765 82.8 1.1e-15 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 725 79.2 1.3e-14 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 725 79.2 1.3e-14 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 715 78.4 2.7e-14 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 700 77.0 5.9e-14 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 693 76.4 9.1e-14 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 692 76.3 9.8e-14 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 657 73.2 9e-13 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 643 72.0 2.2e-12 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 631 71.3 6.6e-12 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 595 67.7 4e-11 >>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa) initn: 4128 init1: 4128 opt: 4128 Z-score: 2003.0 bits: 380.8 E(32554): 3e-105 Smith-Waterman score: 4128; 100.0% identity (100.0% similar) in 628 aa overlap (1-628:1-628) 10 20 30 40 50 60 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRSGAGGFGSRSLYNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MSRQASKTSGGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRSGAGGFGSRSLYNL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 GGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGGFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGGFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQSLL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 QPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGTSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGTSS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 ISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRTAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRTAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 ENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLSMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLSMD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 NNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEIIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEIIE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 LNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDLAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDLAR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 LLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGYGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGYGG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 GYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGARYGVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGARYGVS 550 560 570 580 590 600 610 620 pF1KE6 GGGFSSASNRGGSIKFSQSSQSSQRYSR :::::::::::::::::::::::::::: CCDS44 GGGFSSASNRGGSIKFSQSSQSSQRYSR 610 620 >>CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 (638 aa) initn: 2604 init1: 1692 opt: 2559 Z-score: 1251.9 bits: 241.8 E(32554): 2.1e-63 Smith-Waterman score: 3018; 74.3% identity (86.7% similar) in 654 aa overlap (1-627:1-636) 10 20 30 40 50 pF1KE6 MSRQASKTS-GGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRSGAGGFGSRSLYN :.::. : : .: :::::::::::::::::::::.:::::::: :::::::.:::::::: CCDS88 MNRQVCKKSFSGRSQGFSGRSAVVSGSSRMSCVARSGGAGGGACGFRSGAGSFGSRSLYN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 LGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGGF ::.:::::::::::.:::::::::::::.::::::::: ::..:::::::::.:.:: CCDS88 LGSNKSISISVAAGSSRAGGFGGGRSSCGFAGGYGGGF----GGSYGGGFGGGRGVGSGF 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 GGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQSL :::::::::::::: : :::::.::: :::::::::::::::: .:::: CCDS88 GGAGGFGGAGGFGGPGVFGGPGSFGG------------PGGFGPGGFPGGIQEVIVNQSL 120 130 140 150 160 180 190 200 210 220 230 pF1KE6 LQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGTS :::::::::::::::::::::::::::::::::::::::::::::::::::.::::: :. CCDS88 LQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWELLQQQTTG 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 SISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRTA :: ..::: ::..:..: . ::..::::: :..:::.:.::::::::::::::::::: CCDS88 --SGPSSLEPCFESYISFLCKQLDSLLGERGNLEGELKSMQDLVEDFKKKYEDEINKRTA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 AENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLSM :::::: ::::::.:.:::::::::::.: ::..::::::. :::::::: ::::::::: CCDS88 AENEFVGLKKDVDAAFMNKVELQAKVDSLTDEVSFLRTLYEMELSQMQSHASDTSVVLSM 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 DNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEII :::: ::: :::::::::::.::::::.:::::::::::::::::::::::::::::::. CCDS88 DNNRCLDLGSIIAEVRAQYEEIAQRSKSEAEALYQTKLGELQTTAGRHGDDLRNTKSEIM 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 ELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDLA ::::::::::::::.:::::::::::::::::.:::::::::::::.::.:::.:::::: CCDS88 ELNRMIQRLRAEIENVKKQNANLQTAIAEAEQRGEMALKDANAKLQDLQTALQKAKDDLA 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE6 RLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGYG ::::::::::::::::::::::::::::::: :::::: ::: :::::. :......: . CCDS88 RLLRDYQELMNVKLALDVEIATYRKLLEGEECRMSGECQSAVCISVVSNVTSTSGSSGSS 470 480 490 500 510 520 540 550 560 570 580 pF1KE6 GGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGG------------- : ::..:. .::...:..:.:. : : .:: :.:.:: ::: .:: CCDS88 RGVFGGVSGSGSGGYKGGSSSSSSSGYGVSGGSGSGYGGVSSGSTGGRGSSGSYQSSSSG 530 540 550 560 570 580 590 600 610 620 pF1KE6 -------------SGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR ::.:: ::. .:.:..:... . ::.:::...:::. : CCDS88 SRLGGAGSISVSHSGMGSSSGSIQTSGGSGYKSGGGGSTSIRFSQTTSSSQHSSTK 590 600 610 620 630 >>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa) initn: 1535 init1: 1535 opt: 2280 Z-score: 1118.7 bits: 217.1 E(32554): 5.4e-56 Smith-Waterman score: 2423; 64.6% identity (82.1% similar) in 636 aa overlap (1-625:1-586) 10 20 30 40 50 pF1KE6 MSRQASKT-SGGGSQGFSGRSAVVSGSSRMS--CVAHSGGAGGGAYGFRS-----GAGGF ::::.: . .:::..:: ::.. . :: : :..:::.:::..: : :.::. CCDS88 MSRQSSVSFRSGGSRSFSTASAITPSVSRTSFTSVSRSGGGGGGGFGRVSLAGACGVGGY 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 GSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGG ::::::::::.: ::::...:. : .: ::.: :::. ::::: CCDS88 GSRSLYNLGGSKRISISTSGGSFR------NR------------FGAGAGGGY--GFGGG 70 80 90 100 120 130 140 150 160 170 pF1KE6 RGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQE : : :::: :..:::: .:: .::: ::::::: : :::::: CCDS88 AGSGFGFGG----GAGGGFG----LGGGAGFG--GGFGGPGFPVCP--------PGGIQE 110 120 130 140 180 190 200 210 220 230 pF1KE6 VTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNL ::.::::: :::..:::.: .:...:::::::::::::::::::::::::::::.:::.: CCDS88 VTVNQSLLTPLNLQIDPSIQRVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTL 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE6 LQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYED ::.:::... .:::::::..:: :: ::.:.::::::::::.::.:::::::.:::: CCDS88 LQEQGTKTV--RQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYED 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE6 EINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISD ::::::.:::::: ::::::.::::::::.::::::.:::.:.. ..::::::::.:.:: CCDS88 EINKRTTAENEFVMLKKDVDAAYMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSD 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE6 TSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLR :::::::::::.::::::::::.::::.::.::..:::. :::: ::: :::::::::: CCDS88 TSVVLSMDNNRNLDLDSIIAEVKAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLR 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE6 NTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQ ::: :: :.:::::::::::..:::: ::::.:::.:::.::.::::: :: ::. ::: CCDS88 NTKHEISEMNRMIQRLRAEIDNVKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQ 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE6 QAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTS .::.:.:::::.::::::.::::::::::::::::::: :.::: . :.::::.::..: CCDS88 KAKQDMARLLREYQELMNTKLALDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSS 450 460 470 480 490 500 540 550 560 570 580 pF1KE6 A--SAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGG-GIGGGFGGGSSGFSGGSGF . :..::::: :::.:::::::. :::.::: .. ..:: :.:::.. :.::::..:: CCDS88 GYGSGSGYGGGLGGGLGGGLGGGL-AGGSSGSYYSSSSGGVGLGGGLSVGGSGFSASSGR 510 520 530 540 550 590 600 610 620 pF1KE6 GSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR : :. .: :::: :: :.:: ....::.. CCDS88 G--LGVGFG-SGGGSSS------SVKFVSTTSSSRKSFKS 560 570 580 590 >>CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 (639 aa) initn: 2070 init1: 1442 opt: 2257 Z-score: 1107.3 bits: 215.1 E(32554): 2.3e-55 Smith-Waterman score: 2379; 64.8% identity (80.3% similar) in 631 aa overlap (10-613:16-606) 10 20 30 40 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR-----MSCVAHSGGAGGGAYGFRSGA ::: .:::. ::::::.:: .::... ::.::: : :. CCDS88 MSCQISCKSRGRGGGGGGFRGFSSGSAVVSGGSRRSTSSFSCLSRHGGGGGG---F--GG 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 GGFGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGG- :::::::: .:::.::::::::.:: ::::. :::.:: ::::::: CCDS88 GGFGSRSLVGLGGTKSISISVAGGG---GGFGA-------AGGFGG-----RGGGFGGGS 60 70 80 90 100 110 120 130 140 150 160 pF1KE6 -FGGGRGM-GGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGF :::: :. :::::: ::::: : ::: :::::: :: :: ::::::::. CCDS88 SFGGGSGFSGGGFGG-GGFGG-GRFGG---FGGPGGVGGLGG---------PGGFGPGGY 110 120 130 140 170 180 190 200 210 220 pF1KE6 PGGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVL ::::.::..::::::::::..::.: .::::::::::::::::::::::::::::::.:: CCDS88 PGGIHEVSVNQSLLQPLNVKVDPEIQNVKAQEREQIKTLNNKFASFIDKVRFLEQQNQVL 150 160 170 180 190 200 230 240 250 260 270 280 pF1KE6 ETKWNLLQQQ--GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVE .:::.::::. :: : ::::.:...:. :. :::.. .:: .:::.::.:::: CCDS88 QTKWELLQQMNVGTRPI----NLEPIFQGYIDSLKRYLDGLTAERTSQNSELNNMQDLVE 210 220 230 240 250 260 290 300 310 320 330 340 pF1KE6 DFKKKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELS :.::::::::::::::::.:::::::::.::: :::::.::: : .::.::..:::::.: CCDS88 DYKKKYEDEINKRTAAENDFVTLKKDVDNAYMIKVELQSKVDLLNQEIEFLKVLYDAEIS 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE6 QMQSHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTA :... ..::.:.:::::.:.::::::::::.::::.:::::: ::::::..: :::.:. CCDS88 QIHQSVTDTNVILSMDNSRNLDLDSIIAEVKAQYEEIAQRSKEEAEALYHSKYEELQVTV 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE6 GRHGDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKL :::::.:.. : :: ::::.::::..:: :::: :.: :::.:::.:: ::::: :: CCDS88 GRHGDSLKEIKIEISELNRVIQRLQGEIAHVKKQCKNVQDAIADAEQRGEHALKDARNKL 390 400 410 420 430 440 470 480 490 500 510 520 pF1KE6 QELQAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSIS ..:. ::::::.:::::::::::::::::::::::::::::::::: ::::. : :..: CCDS88 NDLEEALQQAKEDLARLLRDYQELMNVKLALDVEIATYRKLLEGEECRMSGDLSSNVTVS 450 460 470 480 490 500 530 540 550 560 570 pF1KE6 VVSSSTTS--ASAGGYGGGYGGGMGGGLGGGFSAG------GG--SGSGFGRGGGGGI-G :.::. .: :: ...::. :: :.. :::.:.: :: ::: : ::::.: : CCDS88 VTSSTISSNVASKAAFGGS--GGRGSSSGGGYSSGSSSYGSGGRQSGSRGGSGGGGSISG 510 520 530 540 550 560 580 590 600 610 620 pF1KE6 GGFG-----GGSSGFSGGSGFGSISGARYGVSGGGFSSAS-NRGGSIKFSQSSQSSQRYS ::.: :: : .::: :::::. :: .:: ::.. .:::: CCDS88 GGYGSGGGSGGRYGSGGGSKGGSISGGGYGSGGGKHSSGGGSRGGSSSGGGYGSGGGGSS 570 580 590 600 610 620 pF1KE6 R CCDS88 SVKGSSGEAFGSSVTFSFR 630 >>CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 (644 aa) initn: 1563 init1: 1563 opt: 2257 Z-score: 1107.3 bits: 215.1 E(32554): 2.4e-55 Smith-Waterman score: 2366; 64.8% identity (81.5% similar) in 628 aa overlap (1-613:1-591) 10 20 30 40 pF1KE6 MSRQASKTSG---GGSQGFS-GRSAVVSGSSRM--SCVAHSGGAGG-----GAYGFRSGA :::: :. :: :: ::: : ..... . : : . .:::.:: :. : :: CCDS88 MSRQFSSRSGYRSGG--GFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGA 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 GG-FGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGG :: :::::: ::::.:::::::: ::.:..::::: :::: :.::: : CCDS88 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGG---------YGGG---GFGGG---G 60 70 80 90 100 110 120 130 140 150 160 pF1KE6 FGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPG :::: :.::: :.::::: :. :.::::: ::::: ::.:: :.:: :: CCDS88 FGGG-GFGGGGIGGGGFGGFGS--GGGGFGG-GGFGG-GGYGG--------GYGPVCPPG 110 120 130 140 150 170 180 190 200 210 220 pF1KE6 GIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLET :::::::::::::::::::::.: .::..::::::.:::.:::::::::::::::.::.: CCDS88 GIQEVTINQSLLQPLNVEIDPEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQT 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE6 KWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKK ::.:::: :: . :.:::: ::. :: :: .:.. ....:::::::::.:.:::... CCDS88 KWELLQQVDTS--TRTHNLEPYFESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRN 220 230 240 250 260 290 300 310 320 330 340 pF1KE6 KYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQS :::::::::: :::::::.:::::.:::.::.::::.: : .::::: .::.:::::::. CCDS88 KYEDEINKRTNAENEFVTIKKDVDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQT 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE6 HISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHG .::.:.:.::::::::::::::::::.::::::::.::::::.:::.: ::: :::::: CCDS88 QISETNVILSMDNNRSLDLDSIIAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHG 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE6 DDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQ :..::.: :: ::::.:::::.::..:::: .::: .:..:::.:: :::::. ::..:. CCDS88 DSVRNSKIEISELNRVIQRLRSEIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLE 390 400 410 420 430 440 470 480 490 500 510 520 pF1KE6 AALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSS ::::::.::::::::::::::.:::::.:::::: :::::: :::::: ::.:: :. CCDS88 DALQQAKEDLARLLRDYQELMNTKLALDLEIATYRTLLEGEESRMSGECAPNVSVSV-ST 450 460 470 480 490 500 530 540 550 560 570 580 pF1KE6 STTSASAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIG-GGFG-GGSSGFSGG : :. :.:: :: :::.:.: :.....:::: .: ::::: : :..: :::: ::: CCDS88 SHTTISGGGSRGGGGGGYGSG-GSSYGSGGGS---YGSGGGGGGGRGSYGSGGSSYGSGG 510 520 530 540 550 560 590 600 610 620 pF1KE6 SGFGSISGAR-YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR ...:: .:. .: :.: ::.. :::: CCDS88 GSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGGRGSGGGSSGGSIGGRGSSSGGV 570 580 590 600 610 620 >>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa) initn: 2038 init1: 1559 opt: 2169 Z-score: 1065.8 bits: 207.2 E(32554): 4.8e-53 Smith-Waterman score: 2249; 64.0% identity (80.5% similar) in 606 aa overlap (7-610:9-560) 10 20 30 40 50 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRS .. ... .:::. :: . : :: .: :. : . :.:. : :..:::::: CCDS41 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSVSVSRSRGSGGLGGACGGAGFGSRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 LYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMG ::.:::.: ::: ::: :::..:::: : ::..: :::. : CCDS41 LYGLGGSKRISI------------GGG--SCAISGGYG----SRAGGSYG--FGGA---G 70 80 90 120 130 140 150 160 170 pF1KE6 GGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTIN .:: ::::..:.: :: :: : .::::::: : ::::::::.: CCDS41 SGF----GFGGGAGIG----FGLGGGAGLAGGFGGPGFPVCP--------PGGIQEVTVN 100 110 120 130 140 180 190 200 210 220 230 pF1KE6 QSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQ :::: :::..::: : .:.:.:::::::::::::::::::::::::::::::::.:::.: CCDS41 QSLLTPLNLQIDPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWTLLQEQ 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE6 GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINK ::... .:::::::..:: :: ::.:.::::::::::..:.:::::::.:::::::: CCDS41 GTKTV--RQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRGMQDLVEDFKNKYEDEINK 210 220 230 240 250 300 310 320 330 340 350 pF1KE6 RTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVV ::::::::::::::::.:::::::::::.:.: :::.:::.::::::::::.:::::::: CCDS41 RTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVV 260 270 280 290 300 310 360 370 380 390 400 410 pF1KE6 LSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKS :::::::.::::::::::.::::.:::::.::::. :::: :::.:::::::::::::. CCDS41 LSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQ 320 330 340 350 360 370 420 430 440 450 460 470 pF1KE6 EIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKD :: :.::::::::.::. :::: ::::.:::.:::.::::::::. ::. :. :::.::. CCDS41 EIAEINRMIQRLRSEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQ 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE6 DLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAG ::::::..:::::::::::::::::::::::::: :..:: . :.::::.:...: CCDS41 DLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSS---- 440 450 460 470 480 490 540 550 560 570 580 590 pF1KE6 GYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGAR ::::. : : : ::::: :... :.: :.::::.. ::: . :.:..:..:. CCDS41 GYGGASGVGSGLGLGGG--------SSYSYGSGLGVGGGFSS-SSGRAIGGGLSSVGGGS 500 510 520 530 540 600 610 620 pF1KE6 YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR .. ::.: . CCDS41 STIKYTTTSSSSRKSYKH 550 560 >>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa) initn: 2033 init1: 1558 opt: 2167 Z-score: 1064.9 bits: 207.0 E(32554): 5.4e-53 Smith-Waterman score: 2251; 63.9% identity (80.4% similar) in 606 aa overlap (7-610:9-560) 10 20 30 40 50 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRS .. ... .:::. :: . : :: .: .. : . :.:. : :..:::::: CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAGFGSRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 LYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMG ::.:::.: ::: ::: :::..:::: : ::..: :::. : CCDS88 LYGLGGSKRISI------------GGG--SCAISGGYG----SRAGGSYG--FGGA---G 70 80 90 120 130 140 150 160 170 pF1KE6 GGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTIN .:: ::::..:.: :: :: : .::::::: : ::::::::.: CCDS88 SGF----GFGGGAGIG----FGLGGGAGLAGGFGGPGFPVCP--------PGGIQEVTVN 100 110 120 130 140 180 190 200 210 220 230 pF1KE6 QSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQ :::: :::..::: : .:.:.:::::::::::::::::::::::::::::.:::.:::.: CCDS88 QSLLTPLNLQIDPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE6 GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINK ::... .:::::::..:: :: ::::.::::::::::.::.:::::.:.:::::::: CCDS88 GTKTV--RQNLEPLFEQYINNLRRQLDNIVGERGRLDSELRNMQDLVEDLKNKYEDEINK 210 220 230 240 250 300 310 320 330 340 350 pF1KE6 RTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVV ::::::::::::::::.:::::::::::.:.: :::.:::.::::::::::.:::::::: CCDS88 RTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVV 260 270 280 290 300 310 360 370 380 390 400 410 pF1KE6 LSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKS :::::::.::::::::::.::::.:::::.::::. :::: ::: :::::::::::::. CCDS88 LSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQITAGRHGDDLRNTKQ 320 330 340 350 360 370 420 430 440 450 460 470 pF1KE6 EIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKD :: :.::::::::.::. :::: ::::.:::.:::.::::::::. ::. :. :::.::. CCDS88 EIAEINRMIQRLRSEIDHVKKQCANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQ 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE6 DLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAG ::::::..:::::::::::::::::::::::::: :..:: . :.::::.:...: CCDS88 DLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNISVVQSTVSS---- 440 450 460 470 480 490 540 550 560 570 580 590 pF1KE6 GYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGAR ::::. : : : ::::: :... :.: :.::::.. ::: . :.:..:..:. CCDS88 GYGGASGVGSGLGLGGG--------SSYSYGSGLGVGGGFSS-SSGRATGGGLSSVGGGS 500 510 520 530 540 600 610 620 pF1KE6 YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR .. ::.: . CCDS88 STIKYTTTSSSSRKSYKH 550 560 >>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa) initn: 2025 init1: 1550 opt: 2157 Z-score: 1060.1 bits: 206.2 E(32554): 1e-52 Smith-Waterman score: 2237; 63.5% identity (80.4% similar) in 606 aa overlap (7-610:9-560) 10 20 30 40 50 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRS .. ... .:::. :: . : :: .: .. : . :.:. : :..:::::: CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAGFGSRS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 LYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMG ::.:::.: ::: ::: :::..:::: : ::..: :::. : CCDS88 LYGLGGSKRISI------------GGG--SCAISGGYG----SRAGGSYG--FGGA---G 70 80 90 120 130 140 150 160 170 pF1KE6 GGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTIN .:: ::::..:.: :: :: : .::::::: : ::::::::.: CCDS88 SGF----GFGGGAGIG----FGLGGGAGLAGGFGGPGFPVCP--------PGGIQEVTVN 100 110 120 130 140 180 190 200 210 220 230 pF1KE6 QSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQ :::: :::..::: : .:.:.:::::::::::::::::::::::::::::.:::.:::.: CCDS88 QSLLTPLNLQIDPAIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE6 GTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINK ::... .:::::::..:: :: ::.:.::::::::::.::.:::::.:.:::::::: CCDS88 GTKTV--RQNLEPLFEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDLKNKYEDEINK 210 220 230 240 250 300 310 320 330 340 350 pF1KE6 RTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVV ::::::::::::::::.:::::::::::.:.: :::.:::.::::::::::.:::::::: CCDS88 RTAAENEFVTLKKDVDAAYMNKVELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVV 260 270 280 290 300 310 360 370 380 390 400 410 pF1KE6 LSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKS :::::::.::::::::::.::::.:::::.::::. :::: :::.:::::::::::::. CCDS88 LSMDNNRNLDLDSIIAEVKAQYEEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQ 320 330 340 350 360 370 420 430 440 450 460 470 pF1KE6 EIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKD :: :.::::::::.::. :::: :.::.:::.:::.::::::::. ::. :. :::.::. CCDS88 EIAEINRMIQRLRSEIDHVKKQCASLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQ 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE6 DLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAG ::::::..:::::::::::::::::::::::::: :..:: . :..:::.:. .: CCDS88 DLARLLKEYQELMNVKLALDVEIATYRKLLEGEECRLNGEGVGQVNVSVVQSTISS---- 440 450 460 470 480 490 540 550 560 570 580 590 pF1KE6 GYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGAR ::::. : : : ::::: :... :.: ::::::.. ::: . :.:..:..:. CCDS88 GYGGASGVGSGLGLGGG--------SSYSYGSGLGIGGGFSS-SSGRAIGGGLSSVGGGS 500 510 520 530 540 600 610 620 pF1KE6 YGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR .. ::.: . CCDS88 STIKYTTTSSSSRKSYKH 550 560 >>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa) initn: 1806 init1: 1400 opt: 2034 Z-score: 1001.6 bits: 195.2 E(32554): 1.8e-49 Smith-Waterman score: 2111; 65.5% identity (80.5% similar) in 560 aa overlap (11-568:10-500) 10 20 30 40 50 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSR--MSCVAHSGGAGGGAYGFRSGAGGFGSRSLY :: .::: ::.:.:..: .: :. ::::: : ..::::::::: CCDS41 MIARQQCVRGGPRGFSCGSAIVGGGKRGAFSSVSMSGGAG------RCSSGGFGSRSLY 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 NLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGGFGGGRGMGGG :: ::::::.::: ::: : .: CCDS41 NLRGNKSISMSVA--GSRQG-------AC------------------------------- 60 70 120 130 140 150 160 170 pF1KE6 FGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPGGIQEVTINQS :::::::: .:::: :::: :.:.:. :::: :.: :::::::::: CCDS41 FGGAGGFG-TGGFG--GGFG--GSFSGK---GGPGFPVCPAG--------GIQEVTINQS 80 90 100 110 180 190 200 210 220 230 pF1KE6 LLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWNLLQQQGT :: ::.:::::.: .:...:::::: ::::::::::::.::::::::::::::::::: : CCDS41 LLTPLHVEIDPEIQKVRTEEREQIKLLNNKFASFIDKVQFLEQQNKVLETKWNLLQQQTT 120 130 140 150 160 170 240 250 260 270 280 290 pF1KE6 SSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKKKYEDEINKRT .. : .:::::::.... ::. ::.. ...:::.::::.:.: ::::: :::.:::::: CCDS41 TTSS--KNLEPLFETYLSVLRKQLDTLGNDKGRLQSELKTMQDSVEDFKTKYEEEINKRT 180 190 200 210 220 230 300 310 320 330 340 350 pF1KE6 AAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQSHISDTSVVLS ::::.::.::::::.::.:::::.::::.: :::.::..::::::::::.:.:::::::: CCDS41 AAENDFVVLKKDVDAAYLNKVELEAKVDSLNDEINFLKVLYDAELSQMQTHVSDTSVVLS 240 250 260 270 280 290 360 370 380 390 400 410 pF1KE6 MDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHGDDLRNTKSEI :::::.:::::::::::::::.::::::::::::::::. .:: .. .:::.:.:::::: CCDS41 MDNNRNLDLDSIIAEVRAQYEEIAQRSKAEAEALYQTKVQQLQISVDQHGDNLKNTKSEI 300 310 320 330 340 350 420 430 440 450 460 470 pF1KE6 IELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQAALQQAKDDL ::::::::::::::..::: .::...:.:::.:: :::::..: ::.:::::::..: CCDS41 AELNRMIQRLRAEIENIKKQCQTLQVSVADAEQRGENALKDAHSKRVELEAALQQAKEEL 360 370 380 390 400 410 480 490 500 510 520 530 pF1KE6 ARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSSSTTSASAGGY ::.::.:::::.::::::.:::::::::::::::::::: :::::::::.:: :.:: CCDS41 ARMLREYQELMSVKLALDIEIATYRKLLEGEEYRMSGECQSAVSISVVSGST---STGGI 420 430 440 450 460 470 540 550 560 570 580 590 pF1KE6 GGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFSGGSGFGSISGARYG .:: :.: : ::..:: :.::::::: :: CCDS41 SGGLGSGSGFGLSSGF--GSGSGSGFGFGGSVSGSSSSKIISTTTLNKRR 480 490 500 510 520 >>CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 (578 aa) initn: 1934 init1: 1301 opt: 1975 Z-score: 972.8 bits: 190.1 E(32554): 7.2e-48 Smith-Waterman score: 2064; 60.4% identity (78.5% similar) in 596 aa overlap (1-591:14-559) 10 20 30 40 pF1KE6 MSRQASKTSGGGSQGFSGRSAVVSGSSRMSCVAHSGGAGGGAYGFRS :::.. .::.....: .: :: :: : :. : :::.::... CCDS88 MSHQFSSQSAFSSMSRRVYSTSSSAGSG-GGSPAV--GSV---CYAR-GRCGGGGYGIHG 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 GAGGFGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGG ::::::::::::..::::.. :::. .: ::: : CCDS88 --RGFGSRSLYNLGGSRSISINLM-----------GRSTSGFC--QGGGVG--------- 60 70 80 110 120 130 140 150 160 pF1KE6 GFGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFP :::::::.: : ::::::: ::::::: :: :. :: ::::: : CCDS88 GFGGGRGFGVGSTGAGGFGG-GGFGGAG-------FGTSN-FGL-------GGFGPYCPP 90 100 110 120 130 170 180 190 200 210 220 pF1KE6 GGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLE :::::::::::::.::..:.::.: ..:.:::::: .:::::::::::::::::::.::. CCDS88 GGIQEVTINQSLLEPLHLEVDPEIQRIKTQEREQIMVLNNKFASFIDKVRFLEQQNQVLQ 140 150 160 170 180 190 230 240 250 260 270 280 pF1KE6 TKWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFK :::.:::: .:: .::::::::.::.:. :: .: . .:. : ..:...:.:.:::.: CCDS88 TKWELLQQVNTS--TGTNNLEPLLENYIGDLRRQVDLLSAEQMRQNAEVRSMQDVVEDYK 200 210 220 230 240 250 290 300 310 320 330 340 pF1KE6 KKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQ .::::::::::..::.::.::::::.::..::.:...::.: :..::. :. .::::.: CCDS88 SKYEDEINKRTGSENDFVVLKKDVDAAYVSKVDLESRVDTLTGEVNFLKYLFLTELSQVQ 260 270 280 290 300 310 350 360 370 380 390 400 pF1KE6 SHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRH .:::::.:.::::::::::::::: ::.::: :::::: ::::::::: ::: ::::: CCDS88 THISDTNVILSMDNNRSLDLDSIIDAVRTQYELIAQRSKDEAEALYQTKYQELQITAGRH 320 330 340 350 360 370 410 420 430 440 450 460 pF1KE6 GDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQEL ::::.:.: :: :::: .:::.::: .:::: ..:. :..::..::.::.:: :::.: CCDS88 GDDLKNSKMEIAELNRTVQRLQAEISNVKKQIEQMQSLISDAEERGEQALQDAWQKLQDL 380 390 400 410 420 430 470 480 490 500 510 520 pF1KE6 QAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVS . ::::.:..::::::::: ...:::.:::::::::.:::::: ::::: : ::::: . CCDS88 EEALQQSKEELARLLRDYQAMLGVKLSLDVEIATYRQLLEGEESRMSGELQSHVSISVQN 440 450 460 470 480 490 530 540 550 560 570 580 pF1KE6 SSTT-SASAGG---YG-GGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSG :... ...::: :: :::::: ::: ::: : ::.. : . ::: : : : :::: : CCDS88 SQVSVNGGAGGGGSYGSGGYGGGSGGGYGGGRSYRGGGARGRS-GGGYGSGCGGGGGSYG 500 510 520 530 540 550 590 600 610 620 pF1KE6 FSGGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR :: :: :: CCDS88 GSGRSGRGSSRVQIIQTSTNTSHRRILE 560 570 628 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 15:56:32 2016 done: Tue Nov 8 15:56:33 2016 Total Scan time: 3.530 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]