FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6156, 637 aa 1>>>pF1KB6156 637 - 637 aa - 637 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.9489+/-0.00171; mu= -4.0971+/- 0.103 mean_var=487.3308+/-99.417, 0's: 0 Z-trim(110.3): 147 B-trim: 92 in 1/52 Lambda= 0.058098 statistics sampled from 11368 (11508) to 11368 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.354), width: 16 Scan time: 4.110 The best scores are: opt bits E(32554) CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 4177 365.5 1.3e-100 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 2571 230.9 4.2e-60 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 2258 204.6 3.3e-52 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 2252 204.1 4.6e-52 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 2188 198.7 1.8e-50 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 2157 196.1 1.1e-49 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 2092 190.7 4.7e-48 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 2091 190.6 5e-48 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 2085 190.1 7.1e-48 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 1913 175.6 1.5e-43 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1901 174.6 3e-43 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1886 173.4 7.3e-43 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1811 167.1 5.5e-41 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1789 165.2 2e-40 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1750 162.0 1.9e-39 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1712 158.8 1.7e-38 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1609 150.2 7.5e-36 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1566 146.5 8e-35 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1566 146.5 8.3e-35 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1559 145.9 1.3e-34 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 1506 141.5 2.6e-33 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1373 130.3 6.1e-30 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1359 129.2 1.4e-29 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1344 127.9 3.2e-29 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1327 126.5 8.8e-29 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1320 125.9 1.3e-28 CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1231 118.3 2e-26 CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 1159 112.4 1.5e-24 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 1107 108.1 3.4e-23 CCDS32654.1 KRT9 gene_id:3857|Hs108|chr17 ( 623) 1076 105.6 2.2e-22 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1005 99.4 1.1e-20 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 994 98.5 2e-20 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 792 81.6 2.6e-15 CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 785 80.8 3e-15 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 732 76.6 8.7e-14 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 695 73.4 7.1e-13 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 693 73.4 9.1e-13 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 685 72.6 1.3e-12 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 677 71.9 2e-12 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 673 71.6 2.7e-12 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 644 69.2 1.5e-11 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 618 67.4 1e-10 >>CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 (644 aa) initn: 4078 init1: 3848 opt: 4177 Z-score: 1920.0 bits: 365.5 E(32554): 1.3e-100 Smith-Waterman score: 4177; 98.9% identity (98.9% similar) in 644 aa overlap (1-637:1-644) 10 20 30 40 50 60 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGGFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGGFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKSRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 GFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKSRE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 REQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNLRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 REQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNLRR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 RVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTKVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 RVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTKVD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 LQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQYED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 LQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQYED 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 IAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 IAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQIS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 NLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLEIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 NLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLEIA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 TYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGGSYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 TYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGGSYG 490 500 510 520 530 540 550 560 570 580 590 pF1KB6 SGGGGGGGRGSYGSGG-------GSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSG :::::::::::::::: ::::::::::::::::::::::::::::::::::::: CCDS88 SGGGGGGGRGSYGSGGSSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSG 550 560 570 580 590 600 600 610 620 630 pF1KB6 GRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR :::::::::::::::::::::::::::::::::::::::::::: CCDS88 GRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR 610 620 630 640 >>CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 (639 aa) initn: 2142 init1: 2142 opt: 2571 Z-score: 1192.6 bits: 230.9 E(32554): 4.2e-60 Smith-Waterman score: 2586; 66.8% identity (84.7% similar) in 647 aa overlap (1-626:1-623) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGG-----FSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGS :: :.: .: :.::: :::::: . . .::.::: . .: :::::. CCDS88 MSCQISCKSRGRGGGGGGFRGFSSGSAVVSGGSRRSTSSFSC--------LSRHGGGGGG 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 FGAGGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGG--GGFGGGG-FGGG-GFGG :: ::::::::::.:::.:::::::: ::: : : .::.:: ::::::. :::: ::.: CCDS88 FG-GGGFGSRSLVGLGGTKSISISVA-GGGGGFGAAGGFGGRGGGFGGGSSFGGGSGFSG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 GGIGGGGFGGFGSGGGGFGG-GGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEID ::.::::::: : :: ::: :: :: : ::.:: ::::.::..::::::::::..: CCDS88 GGFGGGGFGG-GRFGG-FGGPGGVGGLGGPGGFGPGGYPGGIHEVSVNQSLLQPLNVKVD 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 PEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPY ::::.::..::::::.:::.:::::::::::::::::::::::::::....:: :::: CCDS88 PEIQNVKAQEREQIKTLNNKFASFIDKVRFLEQQNQVLQTKWELLQQMNVGTRPINLEPI 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 FESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKD :...:..:.: .: : .... .:::.::::.::::..:::::::::: :::.:::.::: CCDS88 FQGYIDSLKRYLDGLTAERTSQNSELNNMQDLVEDYKKKYEDEINKRTAAENDFVTLKKD 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 VDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSI ::.::: ::.::.:.: :.:::.:: .::.::.::.. ....:::::::::.:.:::::: CCDS88 VDNAYMIKVELQSKVDLLNQEIEFLKVLYDAEISQIHQSVTDTNVILSMDNSRNLDLDSI 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 IAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRS :::::::::.:::.:: :::.::.:::::::.:.::::::... ::::::::::::::.. CCDS88 IAEVKAQYEEIAQRSKEEAEALYHSKYEELQVTVGRHGDSLKEIKIEISELNRVIQRLQG 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB6 EIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMN :: .:::: .:.:..:.:::::::.:::::.:::::::.::::::::::::::::::::: CCDS88 EIAHVKKQCKNVQDAIADAEQRGEHALKDARNKLNDLEEALQQAKEDLARLLRDYQELMN 410 420 430 440 450 460 480 490 500 510 520 pF1KB6 TKLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTS--------HTTISGGGSRGGG- .:::::.:::::: :::::: ::::. . ::.:::..: .....:.:.::.. CCDS88 VKLALDVEIATYRKLLEGEECRMSGDLSSNVTVSVTSSTISSNVASKAAFGGSGGRGSSS 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB6 GGGYGSGGSSYGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYR ::::.::.::::::: . :: ::.::: :: :::: ::::::.::. :::: :: . CCDS88 GGGYSSGSSSYGSGGRQSGSRGGSGGG-GSI-SGGG-YGSGGGSGGR--YGSG---GGSK 530 540 550 560 570 580 590 600 610 620 630 pF1KB6 GGS-GGGGGGSSGGR-GSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR ::: .::: ::.::. .::::: ::: .: : .::: ::::::: CCDS88 GGSISGGGYGSGGGKHSSGGGSRGGSSSGGGYGSGG----GGSSSVKGSSGEAFGSSVTF 590 600 610 620 630 CCDS88 SFR >>CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 (638 aa) initn: 2274 init1: 1991 opt: 2258 Z-score: 1050.8 bits: 204.6 E(32554): 3.3e-52 Smith-Waterman score: 2327; 61.3% identity (80.1% similar) in 653 aa overlap (1-633:1-631) 10 20 30 40 50 60 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAGG :.:: ..: . ::: : ..... . : : . ::::.:: ..:: .:. : CCDS88 MNRQVCKKSFSGRSQGFS-GRSAVVSGSSRM--SCVARSGGAGG--GACGFRSGA----G 10 20 30 40 50 70 80 90 100 110 pF1KB6 GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGG---GFGG---GGFGGG-G .:::::: :::..:::::::: :..:..::::: .. ::.:: :::: :::::: : CCDS88 SFGSRSLYNLGSNKSISISVAAGSSRAGGFGGGRSSCGFAGGYGGGFGGSYGGGFGGGRG 60 70 80 90 100 110 120 130 140 150 160 pF1KB6 IGGG--GFGGFGSGGGGFGGGG-FGG-GGYGG--GYGPVCPPGGIQEVTINQSLLQPLNV .:.: : :::: :.::::: : ::: :..:: :.:: ::::::: .:::::::::: CCDS88 VGSGFGGAGGFG-GAGGFGGPGVFGGPGSFGGPGGFGPGGFPGGIQEVIVNQSLLQPLNV 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB6 EIDPEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNL ::::.: .::..::::::.:::.:::::::::::::::.::.:::::::: :.. .: CCDS88 EIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWELLQQQTTGSGPSSL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB6 EPYFESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTI :: :::.:. : ...:.: .... :..:::.:::.:::...:::::::::: :::::: . CCDS88 EPCFESYISFLCKQLDSLLGERGNLEGELKSMQDLVEDFKKKYEDEINKRTAAENEFVGL 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB6 KKDVDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDL :::::.:.:.::.::::.:.: .:..:: .::. ::::::.. :.:.:.::::::: ::: CCDS88 KKDVDAAFMNKVELQAKVDSLTDEVSFLRTLYEMELSQMQSHASDTSVVLSMDNNRCLDL 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB6 DSIIAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQR ::::::.::::.:::.::.:::.:::.: ::: :::::::..::.: :: ::::.::: CCDS88 GSIIAEVRAQYEEIAQRSKSEAEALYQTKLGELQTTAGRHGDDLRNTKSEIMELNRMIQR 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB6 LRSEIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQE ::.::.::::: .::: .:..:::::: :::::. ::.::. :::.::.::::::::::: CCDS88 LRAEIENVKKQNANLQTAIAEAEQRGEMALKDANAKLQDLQTALQKAKDDLARLLRDYQE 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB6 LMNTKLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISG--GGSRG--GGGG :::.:::::.:::::: :::::: :::::: : .:: .. :. :: :.::: :: . CCDS88 LMNVKLALDVEIATYRKLLEGEECRMSGECQSAVCISVVSNVTSTSGSSGSSRGVFGGVS 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB6 GYGSGGSSYGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGG : :::: . ::...: .:: : .:: :: : :: : :: :: :. ::: :.:: : CCDS88 GSGSGGYKGGSSSSS-SSGYGVSGGSGS-GYGGVSSGSTGGRGSSGSYQSSSS------G 540 550 560 570 580 590 600 610 620 630 pF1KB6 SGGGGGGSSGGRGSGGGSSGGSI---GGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR : ::.:: . :: :::.::: :: : .::: :::.:..: .:: : CCDS88 SRLGGAGSISVSHSGMGSSSGSIQTSGGSGYKSGG----GGSTSIRFSQTTSSSQHSSTK 590 600 610 620 630 >>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa) initn: 1596 init1: 1596 opt: 2252 Z-score: 1048.1 bits: 204.1 E(32554): 4.6e-52 Smith-Waterman score: 2363; 63.0% identity (79.6% similar) in 652 aa overlap (1-619:1-623) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGG--GFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGA :::: :. :: :: ::: : ..... . : : . .:::.:: :. : :: CCDS44 MSRQASKTSG---GGSQGFS-GRSAVVSGSSRM--SCVAHSGGAGG-----GAYGFRSGA 10 20 30 40 60 70 80 90 100 pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGG---------YGGG---GFGGG---G :: :::::: ::::.:::::::: ::.:..::::: :::: :.::: : CCDS44 GG-FGSRSLYNLGGNKSISISVAAGGSRAGGFGGGRSSCAFAGGYGGGFGSGYGGGFGGG 50 60 70 80 90 100 110 120 130 140 150 pF1KB6 FGGG-GFGGGGIGGGGFGGFGS--GGGGFGG-GGFGG-GGYGG--------GYGPVCPPG :::: :.::: :.::::: :. :.::::: ::::: ::.:: :.:: :: CCDS44 FGGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGSLGSPGGFGPGGFPG 110 120 130 140 150 160 160 170 180 190 200 210 pF1KB6 GIQEVTINQSLLQPLNVEIDPEIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQT :::::::::::::::::::::.: .::..::::::.:::.:::::::::::::::.::.: CCDS44 GIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNKVLET 170 180 190 200 210 220 220 230 240 250 260 pF1KB6 KWELLQQVDTST--RTHNLEPYFESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRN ::.:::: ::. :.:::: ::. :: :: .:.. ....:::::::::.:.:::... CCDS44 KWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVEDFKK 230 240 250 260 270 280 270 280 290 300 310 320 pF1KB6 KYEDEINKRTNAENEFVTIKKDVDGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQT :::::::::: :::::::.:::::.:::.::.::::.: : .::::: .::.:::::::. CCDS44 KYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELSQMQS 290 300 310 320 330 340 330 340 350 360 370 380 pF1KB6 QISETNVILSMDNNRSLDLDSIIAEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHG .::.:.:.::::::::::::::::::.::::::::.::::::.:::.: ::: :::::: CCDS44 HISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTAGRHG 350 360 370 380 390 400 390 400 410 420 430 440 pF1KB6 DSVRNSKIEISELNRVIQRLRSEIDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLE :..::.: :: ::::.:::::.::..:::: .::: .:..:::.:: :::::. ::..:. CCDS44 DDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKLQELQ 410 420 430 440 450 460 450 460 470 480 490 500 pF1KB6 DALQQAKEDLARLLRDYQELMNTKLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTS ::::::.::::::::::::::.:::::.:::::: :::::: :::::: ::.:: .: CCDS44 AALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSISVVSS 470 480 490 500 510 520 510 520 530 540 550 560 pF1KB6 HTTISGGGSRGGGGGGYGSGGSSYGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGH :: ..: :: ::::: :: . : ::: ...:::.:.: .: ::::: CCDS44 STT---SASAGGYGGGYG-GGMGGGLGGG-FSAGGGSGSG----------FGRGGGGGIG 530 540 550 560 570 570 580 590 600 610 620 pF1KB6 GSYGSGSSSGGYRGGSGGGG-GGSSGGRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKF :..:.::: :. :::: :. .:. : ..:: ::... :: . : . .:: CCDS44 GGFGGGSS--GFSGGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR 580 590 600 610 620 630 pF1KB6 VSTTYSGVTR >>CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 (578 aa) initn: 1955 init1: 1955 opt: 2188 Z-score: 1019.6 bits: 198.7 E(32554): 1.8e-50 Smith-Waterman score: 2280; 62.7% identity (83.3% similar) in 593 aa overlap (1-584:1-560) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSS-------CGGGG ::.::::.:. ::: : .: ..::. ::::. .: ::::: CCDS88 MSHQFSSQSA------FSSMS------RRVYSTSSSAGSGGGSPAVGSVCYARGRCGGGG 10 20 30 40 60 70 80 90 100 110 pF1KB6 GSFGAGG-GFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGG .: : ::::::: :::::.::::.. : ::: : : :::: :: ::: : CCDS88 --YGIHGRGFGSRSLYNLGGSRSISINLM--GRSTSGFCQGGGVGGFG----GGRGFGVG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 GIGGGGFGGFGSGGGGFGGGGFGGGGYG-GGYGPVCPPGGIQEVTINQSLLQPLNVEIDP . :.::::: :::::.::: ...: ::.:: ::::::::::::::::.::..:.:: CCDS88 STGAGGFGG-----GGFGGAGFGTSNFGLGGFGPYCPPGGIQEVTINQSLLEPLHLEVDP 110 120 130 140 150 180 190 200 210 220 230 pF1KB6 EIQKVKSREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYF :::..:..::::: :::.::::::::::::::::::::::::::::.::: :.:::: . CCDS88 EIQRIKTQEREQIMVLNNKFASFIDKVRFLEQQNQVLQTKWELLQQVNTSTGTNNLEPLL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB6 ESFINNLRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDV :..:..:::.:: :...: : ..:...:::.::::..::::::::::..::.::..:::: CCDS88 ENYIGDLRRQVDLLSAEQMRQNAEVRSMQDVVEDYKSKYEDEINKRTGSENDFVVLKKDV 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB6 DGAYMTKVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSII :.::..::::....:.: :..:: :. .::::.::.::.::::::::::::::::::: CCDS88 DAAYVSKVDLESRVDTLTGEVNFLKYLFLTELSQVQTHISDTNVILSMDNNRSLDLDSII 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB6 AEVKAQYEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSE :..::: :::.:: :::.:::.::.:::::::::::...:::.::.::::..:::..: CCDS88 DAVRTQYELIAQRSKDEAEALYQTKYQELQITAGRHGDDLKNSKMEIAELNRTVQRLQAE 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB6 IDNVKKQISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNT :.:::::: ..:. :::::.:::.::.:: .::.:::.::::.::.::::::::: .... CCDS88 ISNVKKQIEQMQSLISDAEERGEQALQDAWQKLQDLEEALQQSKEELARLLRDYQAMLGV 400 410 420 430 440 450 480 490 500 510 520 530 pF1KB6 KLALDLEIATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSS ::.::.:::::: :::::::::::: .::.::..:.....::. ::::.::::: . CCDS88 KLSLDVEIATYRQLLEGEESRMSGELQSHVSISVQNSQVSVNGGA---GGGGSYGSGGYG 460 470 480 490 500 510 540 550 560 570 580 590 pF1KB6 YGSGGGSYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGS ::::: ::.: . :: :. : .::.:::: :::: ::::... :: ::.: CCDS88 GGSGGG-YGGGRSYRGG-GARGRSGGGYGSGCGGGG-GSYGGSGRSG--RGSSRVQIIQT 520 530 540 550 560 600 610 620 630 pF1KB6 SGGRGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR CCDS88 STNTSHRRILE 570 >>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa) initn: 1998 init1: 1998 opt: 2157 Z-score: 1005.4 bits: 196.1 E(32554): 1.1e-49 Smith-Waterman score: 2312; 62.3% identity (80.8% similar) in 636 aa overlap (1-633:1-583) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGG--FSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGA :::: :: : .::::. ::..:: . .: . .: .: .::::: :. . .: . :. CCDS88 MSRQ-SSVS-FRSGGSRSFSTASAITPSVSRTSFTSVSRSGGGGGGGFGRVSLAG-ACGV 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGG-GFGGGGFGGGGFGGGGIGGG :: .::::: :::::: ::::.. ::. . ::.: ::: :::::. :.::: :: .:: CCDS88 GG-YGSRSLYNLGGSKRISISTS-GGSFRNRFGAGAGGGYGFGGGA--GSGFGFGGGAGG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB6 GFGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVK ::: .: ::.::::: ::: :. ::::::::::::.::::: :::..::: ::.:. CCDS88 GFG-LG-GGAGFGGG-FGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPSIQRVR 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 SREREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINN ..::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..::: CCDS88 TEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQYINN 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 LRRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMT :::..:.. ....::::::.::::.:::..:::::::::::.:::::: .:::::.:::. CCDS88 LRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEINKRTTAENEFVMLKKDVDAAYMN 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 KVDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQ ::.:.::.: :..::.:. ...::::::::..:.:.:.:::::::.::::::::::::: CCDS88 KVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVKAQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 YEDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKK ::.::..:..:::: ::.:::::: :::::::..::.: ::::.::.:::::.::::::: CCDS88 YEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNTKHEISEMNRMIQRLRAEIDNVKK 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB6 QISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDL : .:::..:.::::::: :::::.::: .::.:::.::.:.:::::.::::::::::::. CCDS88 QCANLQNAIADAEQRGELALKDARNKLAELEEALQKAKQDMARLLREYQELMNTKLALDV 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB6 EIATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGG :::::: :::::: :.::: . :..:: :: ..:.: CCDS88 EIATYRKLLEGEECRLSGEGVGPVNISVVTS--SVSSG---------------------- 470 480 490 500 540 550 560 570 580 590 pF1KB6 SYGSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGGRGS ::::.: ::: : :. ::. :.: .::. ::: :.:: :: : ::: : : :: CCDS88 -YGSGSGYGGGLG--GGLGGGLGGGLAGGSSGSYYSSSS-----GGVGLGGGLSVG--GS 510 520 530 540 550 600 610 620 630 pF1KB6 GGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR : ..:.: : : .::: :.:::::::::: : CCDS88 GFSASSGRGLGVGFGSGG----GSSSSVKFVSTTSSSRKSFKS 560 570 580 590 >>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa) initn: 1946 init1: 1946 opt: 2092 Z-score: 976.2 bits: 190.7 E(32554): 4.7e-48 Smith-Waterman score: 2200; 64.0% identity (82.4% similar) in 581 aa overlap (2-577:3-557) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSS-STRRSGGGGGRFSSCGGGGGSFGA : . . :: : :::..:: . . .: :: :. :: :.:: ..:::.: CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAG----- 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGG :::::: .::::: ::: ::: . ...::::. . :. ::::.: .: :.:::. CCDS88 ---FGSRSLYGLGGSKRISI----GGG-SCAISGGYGSRAGGSYGFGGAG-SGFGFGGGA 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 FGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKS ::: :::. .::::: :. ::::::::::::.::::: :::..::: ::.:.. CCDS88 GIGFGLGGGAGLAGGFGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 REREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNL .::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..:::: CCDS88 EEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQYINNL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 RRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTK ::..:.. ....::::::.::::.::: .::::::::::: :::::::.:::::.:::.: CCDS88 RRQLDNIVGERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 VDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQY :.:::: :.: .::.:: :::.::::::::.::.:.:.:::::::.:::::::::::::: CCDS88 VELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQY 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 EDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQ :.:::.:.::::: ::.::::::::::::::..::.: ::.:.::.:::::::::.:::: CCDS88 EEIAQRSRAEAESWYQTKYEELQITAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQ 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB6 ISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLE .::: .:.::::::: :::::::::. ::::::.::.::::::..::::::.:::::.: CCDS88 CANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVE 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB6 IATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYG-SGGSSYGSGGG ::::: :::::: :..:: . .:..:: : :. :: :. .: :.: : .::::: CCDS88 IATYRKLLEGEECRLNGEGVGQVNISVVQS-TVSSGYGGASGVGSGLGLGGGSSY----- 470 480 490 500 510 540 550 560 570 580 590 pF1KB6 SYGSGGGGGGGRGSYGSG---GGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGG ::::: : ::: .: .:: ::. .: :::.. .: . ::: CCDS88 SYGSGLGVGGGFSS-SSGRATGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 520 530 540 550 560 600 610 620 630 pF1KB6 RGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR >>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa) initn: 1945 init1: 1945 opt: 2091 Z-score: 975.7 bits: 190.6 E(32554): 5e-48 Smith-Waterman score: 2199; 63.7% identity (82.6% similar) in 581 aa overlap (2-577:3-557) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSS-STRRSGGGGGRFSSCGGGGGSFGA : . . :: : :::..:: . . .: :: :. :: :.:: ..:::.: CCDS41 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSVSVSRSRGSGGLGGACGGAG----- 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGG :::::: .::::: ::: ::: . ...::::. . :. ::::.: .: :.:::. CCDS41 ---FGSRSLYGLGGSKRISI----GGG-SCAISGGYGSRAGGSYGFGGAG-SGFGFGGGA 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 FGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKS ::: :::. .::::: :. ::::::::::::.::::: :::..::: ::.:.. CCDS41 GIGFGLGGGAGLAGGFGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPTIQRVRA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 REREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNL .::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..:::: CCDS41 EEREQIKTLNNKFASFIDKVRFLEQQNKVLETKWTLLQEQGTKTVRQNLEPLFEQYINNL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 RRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTK ::..:.. ....::::::..:::.:::..::::::::::: :::::::.:::::.:::.: CCDS41 RRQLDSIVGERGRLDSELRGMQDLVEDFKNKYEDEINKRTAAENEFVTLKKDVDAAYMNK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 VDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQY :.:::: :.: .::.:: :::.::::::::.::.:.:.:::::::.:::::::::::::: CCDS41 VELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQY 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 EDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQ :.:::.:.::::: ::.::::::.:::::::..::.: ::.:.::.:::::::::.:::: CCDS41 EEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQ 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB6 ISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLE .::: .:.::::::: :::::::::. ::::::.::.::::::..::::::.:::::.: CCDS41 CANLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVE 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB6 IATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYG-SGGSSYGSGGG ::::: :::::: :..:: . .:..:: : :. :: :. .: :.: : .::::: CCDS41 IATYRKLLEGEECRLNGEGVGQVNISVVQS-TVSSGYGGASGVGSGLGLGGGSSY----- 470 480 490 500 510 540 550 560 570 580 590 pF1KB6 SYGSGGGGGGGRGSYGSG---GGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGG ::::: : ::: .: .:: ::. .: :::.. .: . ::: CCDS41 SYGSGLGVGGGFSS-SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 520 530 540 550 560 600 610 620 630 pF1KB6 RGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR >>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa) initn: 1939 init1: 1939 opt: 2085 Z-score: 973.0 bits: 190.1 E(32554): 7.1e-48 Smith-Waterman score: 2193; 63.9% identity (82.3% similar) in 581 aa overlap (2-577:3-557) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSS-STRRSGGGGGRFSSCGGGGGSFGA : . . :: : :::..:: . . .: :: :. :: :.:: ..:::.: CCDS88 MASTSTTIRSHSSSRRGFSANSARLPGVSRSGFSSISVSRSRGSGGLGGACGGAG----- 10 20 30 40 50 60 70 80 90 100 110 pF1KB6 GGGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGG :::::: .::::: ::: ::: . ...::::. . :. ::::.: .: :.:::. CCDS88 ---FGSRSLYGLGGSKRISI----GGG-SCAISGGYGSRAGGSYGFGGAG-SGFGFGGGA 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 FGGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKS ::: :::. .::::: :. ::::::::::::.::::: :::..::: ::.:.. CCDS88 GIGFGLGGGAGLAGGFGGPGF-----PVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 REREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNL .::::::.:::.:::::::::::::::.::.::: :::. :.: .:::: ::..:::: CCDS88 EEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGTKTVRQNLEPLFEQYINNL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 RRRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTK ::..:.. ....::::::.::::.::: .::::::::::: :::::::.:::::.:::.: CCDS88 RRQLDSIVGERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 VDLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQY :.:::: :.: .::.:: :::.::::::::.::.:.:.:::::::.:::::::::::::: CCDS88 VELQAKADTLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQY 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 EDIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQ :.:::.:.::::: ::.::::::.:::::::..::.: ::.:.::.:::::::::.:::: CCDS88 EEIAQRSRAEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQ 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB6 ISNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLE ..:: .:.::::::: :::::::::. ::::::.::.::::::..::::::.:::::.: CCDS88 CASLQAAIADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVE 410 420 430 440 450 460 480 490 500 510 520 530 pF1KB6 IATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYG-SGGSSYGSGGG ::::: :::::: :..:: . .:.::: : : :: :. .: :.: : .::::: CCDS88 IATYRKLLEGEECRLNGEGVGQVNVSVVQS-TISSGYGGASGVGSGLGLGGGSSY----- 470 480 490 500 510 540 550 560 570 580 590 pF1KB6 SYGSGGGGGGGRGSYGSG---GGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGG ::::: : ::: .: .:: ::. .: :::.. .: . ::: CCDS88 SYGSGLGIGGGFSS-SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 520 530 540 550 560 600 610 620 630 pF1KB6 RGSGGGSSGGSIGGRGSSSGGVKSSGGSSSVKFVSTTYSGVTR >>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa) initn: 1940 init1: 1771 opt: 1913 Z-score: 895.5 bits: 175.6 E(32554): 1.5e-43 Smith-Waterman score: 2003; 60.9% identity (81.2% similar) in 558 aa overlap (1-558:2-507) 10 20 30 40 50 pF1KB6 MSRQFSSRSGYRSGGGFSSGSAGIINYQRRTTSSSTRRSGGGGGRFSSCGGGGGSFGAG ..:: :.: : ::: ::: :.. .: . ::. :::.: : :: CCDS41 MIARQQCVRGGPR---GFSCGSA-IVGGGKRGAFSSVSMSGGAG-RCSS----------- 10 20 30 40 60 70 80 90 100 110 pF1KB6 GGFGSRSLVNLGGSKSISISVARGGGRGSGFGGGYGGGGFGGGGFGGGGFGGGGIGGGGF :::::::: :: :.::::.::: :. .:. :: :.:::: :::::: :::. : CCDS41 GGFGSRSLYNLRGNKSISMSVA-GSRQGACFG---GAGGFGTGGFGGG-FGGS------F 50 60 70 80 90 120 130 140 150 160 170 pF1KB6 GGFGSGGGGFGGGGFGGGGYGGGYGPVCPPGGIQEVTINQSLLQPLNVEIDPEIQKVKSR . :.:: :: :::: ::::::::::::: ::.::::::::::... CCDS41 S--GKGGPGF---------------PVCPAGGIQEVTINQSLLTPLHVEIDPEIQKVRTE 100 110 120 130 180 190 200 210 220 230 pF1KB6 EREQIKSLNNQFASFIDKVRFLEQQNQVLQTKWELLQQVDTSTRTHNLEPYFESFINNLR :::::: :::.::::::::.::::::.::.:::.:::: :.: ..:::: ::.... :: CCDS41 EREQIKLLNNKFASFIDKVQFLEQQNKVLETKWNLLQQQTTTTSSKNLEPLFETYLSVLR 140 150 160 170 180 190 240 250 260 270 280 290 pF1KB6 RRVDQLKSDQSRLDSELKNMQDMVEDYRNKYEDEINKRTNAENEFVTIKKDVDGAYMTKV ...: : .:..::.::::.::: :::...:::.:::::: :::.::..:::::.::..:: CCDS41 KQLDTLGNDKGRLQSELKTMQDSVEDFKTKYEEEINKRTAAENDFVVLKKDVDAAYLNKV 200 210 220 230 240 250 300 310 320 330 340 350 pF1KB6 DLQAKLDNLQQEIDFLTALYQAELSQMQTQISETNVILSMDNNRSLDLDSIIAEVKAQYE .:.::.:.:..::.:: .::.::::::::..:.:.:.:::::::.::::::::::.:::: CCDS41 ELEAKVDSLNDEINFLKVLYDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVRAQYE 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB6 DIAQKSKAEAESLYQSKYEELQITAGRHGDSVRNSKIEISELNRVIQRLRSEIDNVKKQI .:::.::::::.:::.: ..:::.. .:::...:.: ::.::::.:::::.::.:.::: CCDS41 EIAQRSKAEAEALYQTKVQQLQISVDQHGDNLKNTKSEIAELNRMIQRLRAEIENIKKQC 320 330 340 350 360 370 420 430 440 450 460 470 pF1KB6 SNLQQSISDAEQRGENALKDAKNKLNDLEDALQQAKEDLARLLRDYQELMNTKLALDLEI ..:: :..:::::::::::::..: .:: :::::::.:::.::.:::::..:::::.:: CCDS41 QTLQVSVADAEQRGENALKDAHSKRVELEAALQQAKEELARMLREYQELMSVKLALDIEI 380 390 400 410 420 430 480 490 500 510 520 530 pF1KB6 ATYRTLLEGEESRMSGECAPNVSVSVSTSHTTISGGGSRGGGGGGYGSGGSSYGSGGGSY :::: :::::: :::::: ::.:: .::. : :: .:: ::: :..: ..: . CCDS41 ATYRKLLEGEEYRMSGECQSAVSISV------VSGSTSTGGISGGLGSG-SGFGLSSG-F 440 450 460 470 480 540 550 560 570 580 590 pF1KB6 GSGGGGGGGRGSYGSGGGSYGSGGGGGGHGSYGSGSSSGGYRGGSGGGGGGSSGGRGSGG :::.:.: : :. ::..: CCDS41 GSGSGSGFGFGGSVSGSSSSKIISTTTLNKRR 490 500 510 520 637 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 20:35:04 2016 done: Sun Nov 6 20:35:05 2016 Total Scan time: 4.110 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]