FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7993, 469 aa 1>>>pF1KB7993 469 - 469 aa - 469 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.3178+/-0.00126; mu= -0.3496+/- 0.075 mean_var=243.8506+/-48.856, 0's: 0 Z-trim(108.4): 120 B-trim: 69 in 1/51 Lambda= 0.082132 statistics sampled from 10077 (10189) to 10077 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.313), width: 16 Scan time: 2.570 The best scores are: opt bits E(32554) CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 2904 357.6 1.6e-98 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 1741 219.9 5.8e-57 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 1722 217.6 2.7e-56 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 1710 216.2 7.2e-56 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 1709 216.1 7.8e-56 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 1707 215.8 9e-56 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 1693 214.1 2.6e-55 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 1693 214.1 2.7e-55 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 1623 205.9 9.9e-53 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 1616 205.0 1.5e-52 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 1595 202.5 8.7e-52 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 1569 199.5 8.4e-51 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 1558 198.2 2e-50 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 1548 197.0 4.2e-50 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 1546 196.7 4.7e-50 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 1514 193.0 7.8e-49 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 1494 190.6 3.4e-48 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 1467 187.4 3.4e-47 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 1465 187.1 3.7e-47 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 1430 183.1 7.7e-46 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 1388 178.0 2e-44 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 1387 177.9 2.2e-44 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 1372 176.1 7.6e-44 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 1348 173.3 5.4e-43 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 1347 173.1 5.7e-43 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 1333 171.5 1.8e-42 CCDS73473.1 KRT78 gene_id:196374|Hs108|chr12 ( 410) 1165 151.5 1.5e-36 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 1063 139.4 7.2e-33 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 1057 138.7 1.1e-32 CCDS53795.1 KRT72 gene_id:140807|Hs108|chr12 ( 469) 1027 135.2 1.4e-31 CCDS73472.1 KRT85 gene_id:3891|Hs108|chr12 ( 295) 890 118.8 7.7e-27 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 795 107.7 2.7e-23 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 793 107.5 3.6e-23 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 765 104.1 3e-22 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 753 102.7 8e-22 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 753 102.7 8.1e-22 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 750 102.4 1.1e-21 CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 741 101.3 2.3e-21 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 709 97.5 3.3e-20 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 699 96.6 1.2e-19 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 638 89.1 1e-17 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 622 87.2 3.9e-17 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 617 86.7 7.1e-17 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 608 85.5 1.2e-16 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 615 86.6 1.3e-16 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 603 85.0 1.9e-16 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 598 84.4 2.9e-16 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 592 83.6 4.2e-16 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 587 83.0 6.5e-16 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 585 82.8 8.7e-16 >>CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 (469 aa) initn: 2904 init1: 2904 opt: 2904 Z-score: 1882.2 bits: 357.6 E(32554): 1.6e-98 Smith-Waterman score: 2904; 99.6% identity (100.0% similar) in 469 aa overlap (1-469:1-469) 10 20 30 40 50 60 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYGGPVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYGGPVG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 TKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 TKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 EDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQI :::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 EDEINHRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 SDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 SDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 LRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 LRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 LQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNSTG :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 LQRGKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNSTG 370 380 390 400 410 420 430 440 450 460 pF1KB7 GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS88 GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD 430 440 450 460 >>CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 (590 aa) initn: 1895 init1: 1328 opt: 1741 Z-score: 1136.1 bits: 219.9 E(32554): 5.8e-57 Smith-Waterman score: 1756; 61.7% identity (80.4% similar) in 491 aa overlap (1-468:74-559) 10 20 30 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSAR .:: :. : .: .: .: : ..: CCDS88 GGFGRVSLAGACGVGGYGSRSLYNLGGSKRISISTSGGSFRNRFGAGAGGGYGFG-GGAG 50 60 70 80 90 100 40 50 60 70 80 pF1KB7 PG---GLGSSSLYGLGASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADP : : :... .:::.. .. ...::: .::.:::.:::::.:: :. :: CCDS88 SGFGFGGGAGGGFGLGGG---AGFGGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDP 110 120 130 140 150 90 100 110 120 130 140 pF1KB7 SLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDI :.:::: :: :::::::::::::::::::::::::.:.::::::::: . :. : : . CCDS88 SIQRVRTEEREQIKTLNNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGT-KTVRQNLEPL 160 170 180 190 200 210 150 160 170 180 190 200 pF1KB7 FEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKD :: : .:: ::... . :::..:::.:::.:::::::::::::.::.::::::.:::: CCDS88 FEQYINNLRRQLDSIVGERGRLDSELRNMQDLVEDFKNKYEDEINKRTTAENEFVMLKKD 220 230 240 250 260 270 210 220 230 240 250 260 pF1KB7 VDAAYMSKVELEAKVDALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGI ::::::.::::::::::: :::::.. . ..::...:...:::::::::::.:.::::.: CCDS88 VDAAYMNKVELEAKVDALMDEINFMKMFFDAELSQMQTHVSDTSVVLSMDNNRNLDLDSI 280 290 300 310 320 330 270 280 290 300 310 320 pF1KB7 IAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQA ::::::::::.:. ::.:::.:::::.: :: ::.::::::::..::::::: ::::.: CCDS88 IAEVKAQYEEIANRSRTEAESWYQTKYEELQQTAGRHGDDLRNTKHEISEMNRMIQRLRA 340 350 360 370 380 390 330 340 350 360 370 380 pF1KB7 EIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMS ::::.:.: :.:. :::.::.:::::::::: : ::: :::.::::::: ::::::::. CCDS88 EIDNVKKQCANLQNAIADAEQRGELALKDARNKLAELEEALQKAKQDMARLLREYQELMN 400 410 420 430 440 450 390 400 410 420 430 pF1KB7 VKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVMNST------GGSSSGGGIGLTLGG .:::::.::::::::::::: ::.:.::: :::::..:. .::. :::.: ::: CCDS88 TKLALDVEIATYRKLLEGEECRLSGEGVGPVNISVVTSSVSSGYGSGSGYGGGLGGGLGG 460 470 480 490 500 510 440 450 460 pF1KB7 TMG-------SNALSFSSSAGPGLLKAYSIRTASASRRSARD .: :.. :::.: :: . :. .. : :.: CCDS88 GLGGGLAGGSSGSYYSSSSGGVGLGGGLSVGGSGFSASSGRGLGVGFGSGGGSSSSVKFV 520 530 540 550 560 570 CCDS88 STTSSSRKSFKS 580 590 >>CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 (564 aa) initn: 1794 init1: 1311 opt: 1722 Z-score: 1124.2 bits: 217.6 E(32554): 2.7e-56 Smith-Waterman score: 1722; 64.3% identity (84.9% similar) in 445 aa overlap (14-450:90-524) 10 20 30 40 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG : .:.: :. .. :: : . .::: CCDS41 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG 60 70 80 90 100 110 50 60 70 80 90 pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL .. ... ...::: .::.:::.:::::.:: :. ::..:::: :: :::::: CCDS41 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPTIQRVRAEEREQIKTL 120 130 140 150 160 170 100 110 120 130 140 150 pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ :::::::::::::::::::.::::::::::: . :. : : .:: : .:: ::... CCDS41 NNKFASFIDKVRFLEQQNKVLETKWTLLQEQGT-KTVRQNLEPLFEQYINNLRRQLDSIV 180 190 200 210 220 160 170 180 190 200 210 pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD . :::..:::.:::.:::::::::::::.:::::::::.::::::::::.::::.::.: CCDS41 GERGRLDSELRGMQDLVEDFKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR .:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. :: CCDS41 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR 290 300 310 320 330 340 280 290 300 310 320 330 pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI ::::.:::::.: ::. ::.::::::::..::.:.:: ::::..:::..:.: :.:.::: CCDS41 AEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAI 350 360 370 380 390 400 340 350 360 370 380 390 pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL :.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.::::::::: CCDS41 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL 410 420 430 440 450 460 400 410 420 430 440 450 pF1KB7 EGEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLG-GTMGSNALSFSSSAGPGLLKAY :::: :: :.::: :::::..:: .:. ::. :. : : :... :..:. : : CCDS41 EGEECRLNGEGVGQVNISVVQSTVSSGYGGASGVGSGLGLGGGSSYSYGSGLGVGGGFSS 470 480 490 500 510 520 460 pF1KB7 SIRTASASRRSARD CCDS41 SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 530 540 550 560 >>CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 (564 aa) initn: 1833 init1: 1304 opt: 1710 Z-score: 1116.5 bits: 216.2 E(32554): 7.2e-56 Smith-Waterman score: 1710; 63.6% identity (84.9% similar) in 445 aa overlap (14-450:90-524) 10 20 30 40 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG : .:.: :. .. :: : . .::: CCDS88 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG 60 70 80 90 100 110 50 60 70 80 90 pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL .. ... ...::: .::.:::.:::::.:: :. ::..:::: :: :::::: CCDS88 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTL 120 130 140 150 160 170 100 110 120 130 140 150 pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ :::::::::::::::::::.:.::::::::: . :. : : .:: : .:: ::... CCDS88 NNKFASFIDKVRFLEQQNKVLDTKWTLLQEQGT-KTVRQNLEPLFEQYINNLRRQLDSIV 180 190 200 210 220 160 170 180 190 200 210 pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD . :::..:::.:::.:::.:::::::::.:::::::::.::::::::::.::::.::.: CCDS88 GERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR .:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. :: CCDS88 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR 290 300 310 320 330 340 280 290 300 310 320 330 pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI ::::.:::::.: ::. ::.::::::::..::.:.:: ::::..:::..:.: :.:.::: CCDS88 AEAESWYQTKYEELQVTAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCASLQAAI 350 360 370 380 390 400 340 350 360 370 380 390 pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL :.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.::::::::: CCDS88 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL 410 420 430 440 450 460 400 410 420 430 440 450 pF1KB7 EGEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLG-GTMGSNALSFSSSAGPGLLKAY :::: :: :.::: ::.::..:: .:. ::. :. : : :... :..:. : : CCDS88 EGEECRLNGEGVGQVNVSVVQSTISSGYGGASGVGSGLGLGGGSSYSYGSGLGIGGGFSS 470 480 490 500 510 520 460 pF1KB7 SIRTASASRRSARD CCDS88 SSGRAIGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 530 540 550 560 >>CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 (564 aa) initn: 1780 init1: 1302 opt: 1709 Z-score: 1115.9 bits: 216.1 E(32554): 7.8e-56 Smith-Waterman score: 1709; 63.1% identity (83.5% similar) in 461 aa overlap (14-463:90-535) 10 20 30 40 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLG : .:.: :. .. :: : . .::: CCDS88 SLYGLGGSKRISIGGGSCAISGGYGSRAGGSYGFGGAGSGFGFG----GGAGIG--FGLG 60 70 80 90 100 110 50 60 70 80 90 pF1KB7 ASRPRVAVRSAYGGP-----VGAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL .. ... ...::: .::.:::.:::::.:: :. ::..:::: :: :::::: CCDS88 GG---AGLAGGFGGPGFPVCPPGGIQEVTVNQSLLTPLNLQIDPAIQRVRAEEREQIKTL 120 130 140 150 160 170 100 110 120 130 140 150 pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQ :::::::::::::::::::.:.::::::::: ..:. : : .:: : .:: ::. . CCDS88 NNKFASFIDKVRFLEQQNKVLDTKWTLLQEQ-GTKTVRQNLEPLFEQYINNLRRQLDNIV 180 190 200 210 220 160 170 180 190 200 210 pF1KB7 VDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVD . :::..:::.:::.:::.:::::::::.:::::::::.::::::::::.::::.::.: CCDS88 GERGRLDSELRNMQDLVEDLKNKYEDEINKRTAAENEFVTLKKDVDAAYMNKVELQAKAD 230 240 250 260 270 280 220 230 240 250 260 270 pF1KB7 ALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSR .:.:::::::.: ..::...:..::::::::::::.:.::::.:::::::::::.:. :: CCDS88 TLTDEINFLRALYDAELSQMQTHISDTSVVLSMDNNRNLDLDSIIAEVKAQYEEIAQRSR 290 300 310 320 330 340 280 290 300 310 320 330 pF1KB7 AEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAI ::::.:::::.: :: ::.::::::::..::.:.:: ::::..:::..:.: :.:.::: CCDS88 AEAESWYQTKYEELQITAGRHGDDLRNTKQEIAEINRMIQRLRSEIDHVKKQCANLQAAI 350 360 370 380 390 400 340 350 360 370 380 390 pF1KB7 AEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLL :.::.:::.:::::. : : :: :::.::::.:: :.::::::.::::::.::::::::: CCDS88 ADAEQRGEMALKDAKNKLEGLEDALQKAKQDLARLLKEYQELMNVKLALDVEIATYRKLL 410 420 430 440 450 460 400 410 420 430 440 450 pF1KB7 EGEESRLAGDGVGAVNISVMNST---G-GSSSGGGIGLTLGGTMGSNALSFSSSAGPGLL :::: :: :.::: :::::..:: : :..:: : :: ::: :: :.: ..: :. CCDS88 EGEECRLNGEGVGQVNISVVQSTVSSGYGGASGVGSGLGLGG--GS---SYSYGSGLGVG 470 480 490 500 510 520 460 pF1KB7 KAYSIRTASASRRSARD ..: .. :. CCDS88 GGFSSSSGRATGGGLSSVGGGSSTIKYTTTSSSSRKSYKH 530 540 550 560 >>CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 (551 aa) initn: 1787 init1: 1288 opt: 1707 Z-score: 1114.7 bits: 215.8 E(32554): 9e-56 Smith-Waterman score: 1721; 62.2% identity (80.8% similar) in 490 aa overlap (5-451:32-512) 10 20 30 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGL ::: : ..:::: : :. :.::: ... CCDS88 SRQSSITFQSGSRRGFSTTSAITPAAGRSRFSS-VSVARSAA--GSGGLGRISSA-GASF 10 20 30 40 50 40 50 60 pF1KB7 GSSSLYGLGASRPRVAV-------RSA----------------YGGPVGAG--------- :: :::.::... ::.. ::. ::: ::.: CCDS88 GSRSLYNLGGAK-RVSINGCGSSCRSGFGGRASNRFGVNSGFGYGGGVGGGFSGPSFPVC 60 70 80 90 100 110 70 80 90 100 110 pF1KB7 ----IREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNKL :.:::.:::::.::.:. ::..:::: :: :::::::::::::::::::::::::. CCDS88 PPGGIQEVTVNQSLLTPLHLQIDPTIQRVRAEEREQIKTLNNKFASFIDKVRFLEQQNKV 120 130 140 150 160 170 120 130 140 150 160 170 pF1KB7 LETKWTLLQEQKSAKSSR--LPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVEDF :::::.::::: : .. : : .:.. . :: :::.. .. ::::::::.:::::::: CCDS88 LETKWALLQEQGS-RTVRQNLEPLFDSYTSELRRQLESITTERGRLEAELRNMQDVVEDF 180 190 200 210 220 230 180 190 200 210 220 230 pF1KB7 KNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTEL : .::::::.:::::::::.::::::::::.:::::::: .: .::::.... ..::..: CCDS88 KVRYEDEINKRTAAENEFVALKKDVDAAYMNKVELEAKVKSLPEEINFIHSVFDAELSQL 240 250 260 270 280 290 240 250 260 270 280 290 pF1KB7 QSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAGK :.:..::::::::::.:.::::.::::::::::..:. ::::::.:::::.: ::. ::. CCDS88 QTQVGDTSVVLSMDNNRNLDLDSIIAEVKAQYEDIANRSRAEAESWYQTKYEELQVTAGR 300 310 320 330 340 350 300 310 320 330 340 350 pF1KB7 HGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQEE ::::::::..::::::: ::::.::::..:.: ..:..:::.::.:::::::::::: . CCDS88 HGDDLRNTKQEISEMNRMIQRLRAEIDSVKKQCSSLQTAIADAEQRGELALKDARAKLVD 360 370 380 390 400 410 360 370 380 390 400 410 pF1KB7 LEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISVM :: :::.::::::: ::::::::..:::::.::::::::::::: ::.:.::. :::::. CCDS88 LEEALQKAKQDMARLLREYQELMNIKLALDVEIATYRKLLEGEECRLSGEGVSPVNISVV 420 430 440 450 460 470 420 430 440 450 460 pF1KB7 NST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPGLLKAYSIRTASASRRSARD .:: :..:: :: .: ::: : ::..:.: .: CCDS88 TSTLSSGYGSGSSIGGGNLGLGGGSG---YSFTTSGGHSLGAGLGGSGFSATSNRGLGGS 480 490 500 510 520 530 CCDS88 GSSVKFVSTTSSSQKSYTH 540 550 >>CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 (483 aa) initn: 1242 init1: 1242 opt: 1693 Z-score: 1106.6 bits: 214.1 E(32554): 2.6e-55 Smith-Waterman score: 1693; 62.9% identity (81.8% similar) in 472 aa overlap (6-469:9-470) 10 20 30 40 50 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-LGSSSLYGLGASRPRVAVRSAYG : : :: :::.:. .. ::. ..:::. .:.: : .. ..:: CCDS88 MSIRVTQKSYKVSTSGPRAFSSRS-----YTSGPGSRISSSSFSRVGSSNFRGGLGGGYG 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 GPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQ : : .:: ::.:::::.:: :..::..: :: .:.::::::::::::::::::::::: CCDS88 GASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKEQIKTLNNKFASFIDKVRFLEQQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 NKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVED ::.:::::.:::.::.:.:. . ..::. : .:: :::.: . .::::: .:: .::: CCDS88 NKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLETLGQEKLKLEAELGNMQGLVED 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB7 FKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELTE ::::::::::.:: :::::..::::: :::.:::::.....:.::::::: : : :. : CCDS88 FKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELESRLEGLTDEINFLRQLYEEEIRE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 LQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQAG :::::::::::::::::::::.:.::::::::::..:. ::::::. :: :.: ::. :: CCDS88 LQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIANRSRAEAESMYQIKYEELQSLAG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB7 KHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQE ::::::: :..::::::: :.::::::...:.:::.::::::.::.:::::.::: :: CCDS88 KHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLEAAIADAEQRGELAIKDANAKLS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB7 ELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNISV ::::::::::::::::::::::::.::::::::::::::::::::::: . : :.:. CCDS88 ELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYRKLLEGEESRLES---GMQNMSI 360 370 380 390 400 410 420 430 440 450 460 pF1KB7 MNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAGPGLL-KAYSIRTASASRRSARD ..: :: ::. : ::: : : . ::.:.:: . . .. : :.. ... .:: CCDS88 HTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAGSSSFSRTSSSRAVVVKKIETRD 420 430 440 450 460 470 CCDS88 GKLVSESSDVLPK 480 >>CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 (511 aa) initn: 1242 init1: 1242 opt: 1693 Z-score: 1106.2 bits: 214.1 E(32554): 2.7e-55 Smith-Waterman score: 1693; 62.9% identity (81.8% similar) in 472 aa overlap (6-469:37-498) 10 20 30 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGG-L : : :: :::.:. .. ::. . CCDS58 SQDLQEGISAWFGPPASTPASTMSIRVTQKSYKVSTSGPRAFSSRS-----YTSGPGSRI 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB7 GSSSLYGLGASRPRVAVRSAYGGPVG-AGIREVTINQSLLAPLRLDADPSLQRVRQEESE .:::. .:.: : .. ..::: : .:: ::.:::::.:: :..::..: :: .:.: CCDS58 SSSSFSRVGSSNFRGGLGGGYGGASGMGGITAVTVNQSLLSPLVLEVDPNIQAVRTQEKE 70 80 90 100 110 120 100 110 120 130 140 150 pF1KB7 QIKTLNNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSRLPDIFEAQIAGLRGQLE ::::::::::::::::::::::::.:::::.:::.::.:.:. . ..::. : .:: ::: CCDS58 QIKTLNNKFASFIDKVRFLEQQNKMLETKWSLLQQQKTARSN-MDNMFESYINNLRRQLE 130 140 150 160 170 180 160 170 180 190 200 210 pF1KB7 ALQVDGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEA .: . .::::: .:: .:::::::::::::.:: :::::..::::: :::.:::::. CCDS58 TLGQEKLKLEAELGNMQGLVEDFKNKYEDEINKRTEMENEFVLIKKDVDEAYMNKVELES 190 200 210 220 230 240 220 230 240 250 260 270 pF1KB7 KVDALNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAK ....:.::::::: : : :. ::::::::::::::::::::::.:.::::::::::..:. CCDS58 RLEGLTDEINFLRQLYEEEIRELQSQISDTSVVLSMDNSRSLDMDSIIAEVKAQYEDIAN 250 260 270 280 290 300 280 290 300 310 320 330 pF1KB7 CSRAEAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLE ::::::. :: :.: ::. ::::::::: :..::::::: :.::::::...:.:::.:: CCDS58 RSRAEAESMYQIKYEELQSLAGKHGDDLRRTKTEISEMNRNISRLQAEIEGLKGQRASLE 310 320 330 340 350 360 340 350 360 370 380 390 pF1KB7 AAIAEAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYR ::::.::.:::::.::: :: ::::::::::::::::::::::::.::::::::::::: CCDS58 AAIADAEQRGELAIKDANAKLSELEAALQRAKQDMARQLREYQELMNVKLALDIEIATYR 370 380 390 400 410 420 400 410 420 430 440 pF1KB7 KLLEGEESRLAGDGVGAVNISVMNST-----GGSSSGGGIGLTLGGTMGSNALSFSSSAG :::::::::: . : :.:. ..: :: ::. : ::: : : . ::.:.:: CCDS58 KLLEGEESRLES---GMQNMSIHTKTTSGYAGGLSSAYG-GLTSPGLSYSLGSSFGSGAG 430 440 450 460 470 450 460 pF1KB7 PGLL-KAYSIRTASASRRSARD . . .. : :.. ... .:: CCDS58 SSSFSRTSSSRAVVVKKIETRDGKLVSESSDVLPK 480 490 500 510 >>CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 (628 aa) initn: 1312 init1: 1262 opt: 1623 Z-score: 1060.2 bits: 205.9 E(32554): 9.9e-53 Smith-Waterman score: 1623; 62.8% identity (85.5% similar) in 427 aa overlap (31-450:140-561) 10 20 30 40 50 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYGLGASRPRVAVRSAYG-GPV :::.:.:. .: .: . : : :: CCDS44 GGGRGMGGGFGGAGGFGGAGGFGGAGGFGGPGGFGGSGGFGGPGS-----LGSPGGFGPG 110 120 130 140 150 160 60 70 80 90 100 110 pF1KB7 G--AGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTLNNKFASFIDKVRFLEQQNK : .::.::::::::: :: .. ::.. .:. .: ::::::::::::::::::::::::: CCDS44 GFPGGIQEVTINQSLLQPLNVEIDPQIGQVKAQEREQIKTLNNKFASFIDKVRFLEQQNK 170 180 190 200 210 220 120 130 140 150 160 170 pF1KB7 LLETKWTLLQEQKSAK---SSRLPDIFEAQIAGLRGQLEALQVDGGRLEAELRSMQDVVE .:::::.:::.: ... .. : .:: .: ::. :. . . :::..::..:.:.:: CCDS44 VLETKWNLLQQQGTSSISGTNNLEPLFENHINYLRSYLDNILGERGRLDSELKNMEDLVE 230 240 250 260 270 280 180 190 200 210 220 230 pF1KB7 DFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDALNDEINFLRTLNETELT :::.:::::::.:::::::::.::::::.:::.::::.:::::: :::.::::: ..::. CCDS44 DFKKKYEDEINKRTAAENEFVTLKKDVDSAYMNKVELQAKVDALIDEIDFLRTLYDAELS 290 300 310 320 330 340 240 250 260 270 280 290 pF1KB7 ELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRAEAEAWYQTKFETLQAQA ..::.::::::::::::.::::::.:::::.::::..:. :.::::: ::::. ::. : CCDS44 QMQSHISDTSVVLSMDNNRSLDLDSIIAEVRAQYEDIAQRSKAEAEALYQTKLGELQTTA 350 360 370 380 390 400 300 310 320 330 340 350 pF1KB7 GKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIAEAEERGELALKDARAKQ :.::::::::..:: :.:: ::::.:::...:.: :.:..::::::..::.::::: :: CCDS44 GRHGDDLRNTKSEIIELNRMIQRLRAEIEGVKKQNANLQTAIAEAEQHGEMALKDANAKL 410 420 430 440 450 460 360 370 380 390 400 410 pF1KB7 EELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLEGEESRLAGDGVGAVNIS .::.::::.::.:.:: ::.:::::.::::::.::::::::::::: :..:. .::.:: CCDS44 QELQAALQQAKDDLARLLRDYQELMNVKLALDVEIATYRKLLEGEEYRMSGECPSAVSIS 470 480 490 500 510 520 420 430 440 450 460 pF1KB7 VMNSTGGSSSGGGIGLTLGGTMGSN-ALSFSSSAGPGLLKAYSIRTASASRRSARD :..:. :.:.:: : :: ::.. . .::...: : CCDS44 VVSSSTTSASAGGYGGGYGGGMGGGLGGGFSAGGGSGSGFGRGGGGGIGGGFGGGSSGFS 530 540 550 560 570 580 CCDS44 GGSGFGSISGARYGVSGGGFSSASNRGGSIKFSQSSQSSQRYSR 590 600 610 620 >>CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 (520 aa) initn: 1683 init1: 1194 opt: 1616 Z-score: 1056.8 bits: 205.0 E(32554): 1.5e-52 Smith-Waterman score: 1616; 59.2% identity (84.3% similar) in 458 aa overlap (12-464:58-509) 10 20 30 40 pF1KB7 MSIHFSSPVFTSRSAAFSGRGAQVRLSSARPGGLGSSSLYG ..: ..: :.. . ::.:.... : CCDS41 GAFSSVSMSGGAGRCSSGGFGSRSLYNLRGNKSISMSVAGSRQGACFGGAGGFGTGGFGG 30 40 50 60 70 80 50 60 70 80 90 pF1KB7 -LGASRPRVAVRSAYGGPV--GAGIREVTINQSLLAPLRLDADPSLQRVRQEESEQIKTL .:.: . ... : :: ..::.:::::::::.::... :: .:.:: :: :::: : CCDS41 GFGGS---FSGKGGPGFPVCPAGGIQEVTINQSLLTPLHVEIDPEIQKVRTEEREQIKLL 90 100 110 120 130 140 100 110 120 130 140 150 pF1KB7 NNKFASFIDKVRFLEQQNKLLETKWTLLQEQKSAKSSR-LPDIFEAQIAGLRGQLEALQV :::::::::::.:::::::.:::::.:::.: .. ::. : .::. .. :: ::..: CCDS41 NNKFASFIDKVQFLEQQNKVLETKWNLLQQQTTTTSSKNLEPLFETYLSVLRKQLDTLGN 150 160 170 180 190 200 160 170 180 190 200 210 pF1KB7 DGGRLEAELRSMQDVVEDFKNKYEDEINRRTAAENEFVVLKKDVDAAYMSKVELEAKVDA : :::..::..::: :::::.:::.:::.::::::.::::::::::::..:::::::::. CCDS41 DKGRLQSELKTMQDSVEDFKTKYEEEINKRTAAENDFVVLKKDVDAAYLNKVELEAKVDS 210 220 230 240 250 260 220 230 240 250 260 270 pF1KB7 LNDEINFLRTLNETELTELQSQISDTSVVLSMDNSRSLDLDGIIAEVKAQYEEMAKCSRA ::::::::..: ..::...:...:::::::::::.:.::::.:::::.:::::.:. :.: CCDS41 LNDEINFLKVLYDAELSQMQTHVSDTSVVLSMDNNRNLDLDSIIAEVRAQYEEIAQRSKA 270 280 290 300 310 320 280 290 300 310 320 330 pF1KB7 EAEAWYQTKFETLQAQAGKHGDDLRNTRNEISEMNRAIQRLQAEIDNIKNQRAKLEAAIA :::: :::: . :: .. .:::.:.::..::.:.:: ::::.:::.:::.: :....: CCDS41 EAEALYQTKVQQLQISVDQHGDNLKNTKSEIAELNRMIQRLRAEIENIKKQCQTLQVSVA 330 340 350 360 370 380 340 350 360 370 380 390 pF1KB7 EAEERGELALKDARAKQEELEAALQRAKQDMARQLREYQELMSVKLALDIEIATYRKLLE .::.::: :::::..:. :::::::.::...::.:::::::::::::::::::::::::: CCDS41 DAEQRGENALKDAHSKRVELEAALQQAKEELARMLREYQELMSVKLALDIEIATYRKLLE 390 400 410 420 430 440 400 410 420 430 440 450 pF1KB7 GEESRLAGDGVGAVNISVMNSTGGSSSGGGIGLTLGGTMGSNALS-FSSSAGPGLLKAYS ::: :..:. .::.:::.. ::.: :::. ::. : . : :.:..: :. . : CCDS41 GEEYRMSGECQSAVSISVVS---GSTSTGGISGGLGSGSGFGLSSGFGSGSGSGFGFGGS 450 460 470 480 490 500 460 pF1KB7 IRTASASRRSARD . .:.:. CCDS41 VSGSSSSKIISTTTLNKRR 510 520 469 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 02:36:27 2016 done: Mon Nov 7 02:36:28 2016 Total Scan time: 2.570 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]