FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4453, 473 aa 1>>>pF1KE4453 473 - 473 aa - 473 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.9641+/-0.000518; mu= 2.9620+/- 0.032 mean_var=321.8697+/-64.690, 0's: 0 Z-trim(117.7): 192 B-trim: 0 in 0/53 Lambda= 0.071488 statistics sampled from 29752 (29945) to 29752 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.668), E-opt: 0.2 (0.351), width: 16 Scan time: 10.420 The best scores are: opt bits E(85289) NP_005548 (OMIM: 148067,167200,613000) keratin, ty ( 473) 3032 326.8 7.9e-89 NP_000517 (OMIM: 125595,131760,131800,131900,14806 ( 472) 2553 277.4 5.9e-74 NP_002266 (OMIM: 148030) keratin, type I cytoskele ( 456) 1845 204.4 5.5e-52 NP_000413 (OMIM: 148069,167210,184500) keratin, ty ( 432) 1843 204.1 6.1e-52 NP_705694 (OMIM: 148065,615785) keratin, type I cy ( 458) 1802 199.9 1.2e-50 XP_011523086 (OMIM: 148030) PREDICTED: keratin, ty ( 463) 1793 199.0 2.3e-50 XP_016880103 (OMIM: 148030) PREDICTED: keratin, ty ( 437) 1791 198.8 2.5e-50 NP_002265 (OMIM: 148065,615785) keratin, type I cy ( 420) 1769 196.5 1.2e-49 NP_000412 (OMIM: 113800,148080,607602,609165) kera ( 584) 1644 183.8 1.1e-45 XP_005257400 (OMIM: 113800,148080,607602,609165) P ( 624) 1640 183.4 1.6e-45 NP_002267 (OMIM: 148020) keratin, type I cytoskele ( 400) 1565 175.4 2.5e-43 NP_000214 (OMIM: 122100,601687) keratin, type I cy ( 494) 1557 174.7 5.1e-43 NP_000217 (OMIM: 144200,607606) keratin, type I cy ( 623) 1465 165.4 4.2e-40 NP_061889 (OMIM: 607742) keratin, type I cytoskele ( 525) 1432 161.9 4e-39 XP_016879788 (OMIM: 607742) PREDICTED: keratin, ty ( 494) 1420 160.6 9.1e-39 NP_853515 (OMIM: 616676) keratin, type I cytoskele ( 459) 1383 156.7 1.2e-37 NP_853513 (OMIM: 616677) keratin, type I cytoskele ( 464) 1350 153.3 1.3e-36 NP_853512 (OMIM: 616646,616760) keratin, type I cy ( 450) 1343 152.6 2.1e-36 NP_003762 (OMIM: 604540) keratin, type I cuticular ( 467) 1340 152.3 2.7e-36 XP_011522716 (OMIM: 616646,616760) PREDICTED: kera ( 448) 1339 152.2 2.8e-36 NP_853517 (OMIM: 616675) keratin, type I cytoskele ( 468) 1311 149.3 2.1e-35 XP_011523096 (OMIM: 602764) PREDICTED: keratin, ty ( 455) 1279 146.0 2.1e-34 NP_002271 (OMIM: 602764) keratin, type I cuticular ( 455) 1279 146.0 2.1e-34 NP_002268 (OMIM: 601077) keratin, type I cuticular ( 416) 1222 140.1 1.1e-32 NP_004129 (OMIM: 602761) keratin, type I cuticular ( 404) 1213 139.1 2.1e-32 NP_002270 (OMIM: 602762) keratin, type I cuticular ( 404) 1206 138.4 3.5e-32 NP_061883 (OMIM: 608218) keratin, type I cytoskele ( 424) 1205 138.3 3.9e-32 NP_002269 (OMIM: 602760) keratin, type I cuticular ( 448) 1190 136.8 1.2e-31 XP_006721802 (OMIM: 607742) PREDICTED: keratin, ty ( 427) 1188 136.6 1.3e-31 XP_011523095 (OMIM: 602763) PREDICTED: keratin, ty ( 412) 1181 135.8 2.1e-31 NP_066293 (OMIM: 602763) keratin, type I cuticular ( 436) 1181 135.9 2.2e-31 XP_011522762 (OMIM: 607742) PREDICTED: keratin, ty ( 422) 1177 135.4 2.9e-31 NP_000215 (OMIM: 148070) keratin, type I cytoskele ( 430) 1110 128.5 3.5e-29 NP_954657 (OMIM: 148070) keratin, type I cytoskele ( 430) 1110 128.5 3.5e-29 XP_016879678 (OMIM: 616679) PREDICTED: keratin, ty ( 484) 1098 127.4 8.9e-29 NP_872303 (OMIM: 616679) keratin, type I cytoskele ( 431) 1086 126.1 1.9e-28 NP_056330 (OMIM: 606194) keratin, type I cytoskele ( 422) 1046 121.9 3.3e-27 NP_006762 (OMIM: 604542) keratin, type I cuticular ( 456) 1036 120.9 7.2e-27 NP_998821 (OMIM: 616678) keratin, type I cytoskele ( 491) 1027 120.1 1.4e-26 NP_003761 (OMIM: 604541) keratin, type I cuticular ( 449) 1016 118.9 3e-26 NP_001269362 (OMIM: 606194) keratin, type I cytosk ( 285) 765 92.8 1.4e-18 XP_005257257 (OMIM: 606194) PREDICTED: keratin, ty ( 285) 765 92.8 1.4e-18 XP_011522897 (OMIM: 606194) PREDICTED: keratin, ty ( 285) 765 92.8 1.4e-18 NP_056932 (OMIM: 616671) keratin, type II cytoskel ( 638) 681 84.5 9.4e-16 NP_005373 (OMIM: 162250) neurofilament medium poly ( 916) 672 83.8 2.2e-15 XP_011523088 (OMIM: 602761) PREDICTED: keratin, ty ( 245) 652 81.0 4e-15 NP_002046 (OMIM: 137780,203450) glial fibrillary a ( 432) 657 81.8 4.1e-15 NP_001229305 (OMIM: 137780,203450) glial fibrillar ( 438) 655 81.6 4.7e-15 NP_001124491 (OMIM: 137780,203450) glial fibrillar ( 431) 653 81.4 5.4e-15 XP_016879940 (OMIM: 137780,203450) PREDICTED: glia ( 472) 653 81.5 5.7e-15 >>NP_005548 (OMIM: 148067,167200,613000) keratin, type I (473 aa) initn: 3032 init1: 3032 opt: 3032 Z-score: 1715.7 bits: 326.8 E(85289): 7.9e-89 Smith-Waterman score: 3032; 100.0% identity (100.0% similar) in 473 aa overlap (1-473:1-473) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKVT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 MQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKIIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 MQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKIIA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 ATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEMQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 ATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEMQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 IEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 IEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEKN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 RRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLENS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 RRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLENS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 LEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRRL 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 LEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS ::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_005 LEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS 430 440 450 460 470 >>NP_000517 (OMIM: 125595,131760,131800,131900,148066,16 (472 aa) initn: 2065 init1: 2065 opt: 2553 Z-score: 1448.8 bits: 277.4 E(85289): 5.9e-74 Smith-Waterman score: 2553; 87.3% identity (95.2% similar) in 458 aa overlap (1-456:1-449) 10 20 30 40 50 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSS-RFSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::: NP_000 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSSRFSSG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 GACGLGGGYGGGFSSSSS-FGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEK :: ::::::::::::::: ::::::::::::::::.::: ::::::::::::::::: NP_000 GAYGLGGGYGGGFSSSSSSFGSGFGGGYGGGLGAGLGGG----FGGGFAGGDGLLVGSEK 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 VTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKI ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: NP_000 VTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPAEIKDYSPYFKTIEDLRNKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 IAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLE ..::..::. .:::::::::::::::::: :: ::..::::.::::::::::::::.::: NP_000 LTATVDNANVLLQIDNARLAADDFRTKYETELNLRMSVEADINGLRRVLDELTLARADLE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 MQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAE ::::.::::::::.::::::: :::::.::::::::::::::::::::::::::::.::: NP_000 MQIESLKEELAYLKKNHEEEMNALRGQVGGDVNVEMDAAPGVDLSRILNEMRDQYEKMAE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 KNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLE :::.::: ::..::::::.:::.:::::::..::..::::..:.:::::::::::::::: NP_000 KNRKDAEEWFFTKTEELNREVATNSELVQSGKSEISELRRTMQNLEIELQSQLSMKASLE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 NSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYR ::::::::::::::.::: .::::::::::::::::::.:::.::::::::::::::::: NP_000 NSLEETKGRYCMQLAQIQEMIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 RLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS ::::::::::::.: :. : :::.: .::::: : NP_000 RLLEGEDAHLSSSQFSSGSQSSRDV-----TSSSRQIRTKVMDVHDGKVVSTHEQVLRTK 420 430 440 450 460 470 NP_000 N >>NP_002266 (OMIM: 148030) keratin, type I cytoskeletal (456 aa) initn: 1786 init1: 1368 opt: 1845 Z-score: 1054.3 bits: 204.4 E(85289): 5.5e-52 Smith-Waterman score: 1845; 69.2% identity (86.9% similar) in 428 aa overlap (25-440:14-433) 10 20 30 40 50 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGG-----LSVSS- ::::.: .:.::::. . .. .:: .:.:: NP_002 MTTTFLQTSSSTFGGGSTRGGSLLAGGGGFGGGSLSGGGGSRSISASSA 10 20 30 40 60 70 80 90 100 110 pF1KE4 RFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDG-LL :: :.:. :::::::. ::::: :. .:.:::::.:.::::::.:::: :: NP_002 RFVSSGS---GGGYGGGMRVC-----GFGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 VGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIK-DYSPYFKTIE :.::.::::::::::::::::::::::::::::::.::::.: :. . ::: :::::: NP_002 SGNEKITMQNLNDRLASYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTL .::.::.:.::.:.. ::.:::::::::::: :::.:::::: ::::.:::::::::::: NP_002 ELRDKIMATTIDNSRVILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 ARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQ ::::::::::::.::::::.::::::: . .: .:.:::::::::::::.:.: :::.: NP_002 ARTDLEMQIEGLNEELAYLKKNHEEEMKEFSSQLAGQVNVEMDAAPGVDLTRVLAEMREQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 YEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLS :: ::::::::.:.::.:::::::::::::.:..:.:..:.:.:::..: :::::::::: NP_002 YEAMAEKNRRDVEAWFFSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEIELQSQLS 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 MKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQ :::.::::: ::. :: ::.:::::::..: ::..:::::: :.:::..:::.:::::: NP_002 MKAGLENSLAETECRYATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLDIKTRLEQ 350 360 370 380 390 400 420 430 440 450 460 pF1KE4 EIATYRRLLEGEDAHLSS----QQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFS :::::: ::::.::.... . .:: . :: NP_002 EIATYRSLLEGQDAKMAGIGIREASSGGGGSSSNFHINVEESVDGQVVSSHKREI 410 420 430 440 450 470 pF1KE4 QGQSS >>NP_000413 (OMIM: 148069,167210,184500) keratin, type I (432 aa) initn: 2010 init1: 1803 opt: 1843 Z-score: 1053.5 bits: 204.1 E(85289): 6.1e-52 Smith-Waterman score: 1904; 70.2% identity (84.8% similar) in 446 aa overlap (1-445:1-410) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG ::: ::::::::.::: :.::: . : :.:. :..:::: :. NP_000 MTTSIRQFTSSSSIKGSSGLGGGSSRTSCRLSGGLGAGSCRL----------------GS 10 20 30 40 70 80 90 100 110 pF1KE4 ACGLGGGYGGG-FSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDGLLVGSEKV : :::. ::. .:: ::::: ::::...: : ::::.:.::. NP_000 AGGLGSTLGGSSYSSCYSFGSG--GGYGSSFG----------------GVDGLLAGGEKA 50 60 70 80 120 130 140 150 160 170 pF1KE4 TMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIKDYSPYFKTIEDLRNKII :::::::::::::::::::::::..:::::::::::: :. .::: :..:::.:.:::. NP_000 TMQNLNDRLASYLDKVRALEEANTELEVKIRDWYQRQAPGPARDYSQYYRTIEELQNKIL 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE4 AATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTLARTDLEM .::..::. .::::::::::::::::.: : ::: .::::.::::::::::::::.:::: NP_000 TATVDNANILLQIDNARLAADDFRTKFETEQALRLSVEADINGLRRVLDELTLARADLEM 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE4 QIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMRDQYEQMAEK :::.::::::::.::::::: :::::.::..::::::::::::::::::::::::.:::: NP_000 QIENLKEELAYLKKNHEEEMNALRGQVGGEINVEMDAAPGVDLSRILNEMRDQYEKMAEK 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE4 NRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQLSMKASLEN ::.::: ::.:::::::.:::.:::::::..::..::::..:.::::::::::::::::. NP_000 NRKDAEDWFFSKTEELNREVATNSELVQSGKSEISELRRTMQALEIELQSQLSMKASLEG 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 SLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRLEQEIATYRR .: ::..:::.::::::::::::::::::::::::::.:::.:::::::::::::::::: NP_000 NLAETENRYCVQLSQIQGLIGSVEEQLAQLRCEMEQQNQEYKILLDVKTRLEQEIATYRR 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE4 LLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQGQSS :::::::::. : . . ..:.: : NP_000 LLEGEDAHLT--QYKKEPVTTRQVRTIVEEVQDGKVISSREQVHQTTR 390 400 410 420 430 >>NP_705694 (OMIM: 148065,615785) keratin, type I cytosk (458 aa) initn: 1722 init1: 1299 opt: 1802 Z-score: 1030.3 bits: 199.9 E(85289): 1.2e-50 Smith-Waterman score: 1840; 65.7% identity (84.6% similar) in 449 aa overlap (17-455:9-443) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG : . :::.:::: . :.:: :. :: :.:: ::: NP_705 MSLRLQSSSASYGGGFGGGSCQ----LGGG--RGVST------CSTRFVSGG 10 20 30 40 70 80 90 100 110 pF1KE4 -ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGG--------DG : : ::: . ::.... :::::::::::::.:.:::::.::::::::: : NP_705 SAGGYGGGVSCGFGGGA--GSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGG 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 LLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRP-SEIKDYSPYFKT ::.:.::.:::::::::::::.:::::::::::::::::::. .: : : .:::::.:: NP_705 LLTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 IEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDEL ::.::.::..::::: . ::.:::::::::::: :::.::::::.::::.:::::::::: NP_705 IEELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDEL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 TLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMR ::..::::::::.:.:::::..::::::: . .:. :.:::::::.::.::.:.: ::: NP_705 TLSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMR 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 DQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQ .::: :::.:::::: :: .:. ::::::..:. ..:.:..:.:::::.::::::::::: NP_705 EQYEAMAERNRRDAEEWFHAKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQ 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 LSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRL :::::.:::.. ::. :: .::.::::::.:.: ::..:: ::: :.:::..:::.:::: NP_705 LSMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 EQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQG :::::::: ::::.::.. . .:. : : : . ....::.: : NP_705 EQEIATYRSLLEGQDAKMIGFPSSAGSVSPRSTSVTTTSSASVTTTSNASGRRTSDVRRP 400 410 420 430 440 450 pF1KE4 QSS >>XP_011523086 (OMIM: 148030) PREDICTED: keratin, type I (463 aa) initn: 1356 init1: 815 opt: 1793 Z-score: 1025.2 bits: 199.0 E(85289): 2.3e-50 Smith-Waterman score: 1821; 68.0% identity (85.5% similar) in 435 aa overlap (25-440:14-440) 10 20 30 40 50 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGG-----LSVSS- ::::.: .:.::::. . .. .:: .:.:: XP_011 MTTTFLQTSSSTFGGGSTRGGSLLAGGGGFGGGSLSGGGGSRSISASSA 10 20 30 40 60 70 80 90 100 110 pF1KE4 RFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDG-LL :: :.:. :::::::. ::::: :. .:.:::::.:.::::::.:::: :: XP_011 RFVSSGS---GGGYGGGMRVC-----GFGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 VGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIK-DYSPYFKTIE :.::.::::::::::::::::::::::::::::::.::::.: :. . ::: :::::: XP_011 SGNEKITMQNLNDRLASYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTL .::.::.:.::.:.. ::.:::::::::::: :::.:::::: ::::.:::::::::::: XP_011 ELRDKIMATTIDNSRVILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTL 170 180 190 200 210 220 240 250 260 270 280 pF1KE4 ARTDLEMQIEGLKEELAYLRKNHEE-------EMLALRGQTGGDVNVEMDAAPGVDLSRI ::::::::::::.::::::.::::: :: . .: .:.:::::::::::::.:. XP_011 ARTDLEMQIEGLNEELAYLKKNHEEWVPPILQEMKEFSSQLAGQVNVEMDAAPGVDLTRV 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 LNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEI : :::.::: ::::::::.:.::.:::::::::::::.:..:.:..:.:.:::..: ::: XP_011 LAEMREQYEAMAEKNRRDVEAWFFSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEI 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 ELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLD ::::::::::.::::: ::. :: ::.:::::::..: ::..:::::: :.:::..::: XP_011 ELQSQLSMKAGLENSLAETECRYATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLD 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE4 VKTRLEQEIATYRRLLEGEDAHLSS----QQASGQSYSSREVFTSSSSSSSRQTRPILKE .:::::::::::: ::::.::.... . .:: . :: XP_011 IKTRLEQEIATYRSLLEGQDAKMAGIAIREASSGGGGSSSNFHINVEESVDGQVVSSHKR 410 420 430 440 450 460 470 pF1KE4 QSSSSFSQGQSS XP_011 EI >>XP_016880103 (OMIM: 148030) PREDICTED: keratin, type I (437 aa) initn: 1356 init1: 815 opt: 1791 Z-score: 1024.4 bits: 198.8 E(85289): 2.5e-50 Smith-Waterman score: 1819; 69.5% identity (86.7% similar) in 420 aa overlap (25-429:14-425) 10 20 30 40 50 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGG-----LSVSS- ::::.: .:.::::. . .. .:: .:.:: XP_016 MTTTFLQTSSSTFGGGSTRGGSLLAGGGGFGGGSLSGGGGSRSISASSA 10 20 30 40 60 70 80 90 100 110 pF1KE4 RFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGGDG-LL :: :.:. :::::::. ::::: :. .:.:::::.:.::::::.:::: :: XP_016 RFVSSGS---GGGYGGGMRVC-----GFGGGAGSVFGGGFGGGVGGGFGGGFGGGDGGLL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 VGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRPSEIK-DYSPYFKTIE :.::.::::::::::::::::::::::::::::::.::::.: :. . ::: :::::: XP_016 SGNEKITMQNLNDRLASYLDKVRALEEANADLEVKIHDWYQKQTPTSPECDYSQYFKTIE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDELTL .::.::.:.::.:.. ::.:::::::::::: :::.:::::: ::::.:::::::::::: XP_016 ELRDKIMATTIDNSRVILEIDNARLAADDFRLKYENELALRQGVEADINGLRRVLDELTL 170 180 190 200 210 220 240 250 260 270 280 pF1KE4 ARTDLEMQIEGLKEELAYLRKNHEE-------EMLALRGQTGGDVNVEMDAAPGVDLSRI ::::::::::::.::::::.::::: :: . .: .:.:::::::::::::.:. XP_016 ARTDLEMQIEGLNEELAYLKKNHEEWVPPILQEMKEFSSQLAGQVNVEMDAAPGVDLTRV 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 LNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEI : :::.::: ::::::::.:.::.:::::::::::::.:..:.:..:.:.:::..: ::: XP_016 LAEMREQYEAMAEKNRRDVEAWFFSKTEELNKEVASNTEMIQTSKTEITDLRRTMQELEI 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 ELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLD ::::::::::.::::: ::. :: ::.:::::::..: ::..:::::: :.:::..::: XP_016 ELQSQLSMKAGLENSLAETECRYATQLQQIQGLIGGLEAQLSELRCEMEAQNQEYKMLLD 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE4 VKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSS .:::::::::::: ::::.::... XP_016 IKTRLEQEIATYRSLLEGQDAKMAGIAIREAYSFSL 410 420 430 >>NP_002265 (OMIM: 148065,615785) keratin, type I cytosk (420 aa) initn: 1475 init1: 1266 opt: 1769 Z-score: 1012.4 bits: 196.5 E(85289): 1.2e-49 Smith-Waterman score: 1807; 68.3% identity (86.0% similar) in 420 aa overlap (17-426:9-414) 10 20 30 40 50 60 pF1KE4 MTTCSRQFTSSSSMKGSCGIGGGIGGGSSRISSVLAGGSCRAPSTYGGGLSVSSRFSSGG : . :::.:::: . :.:: :. :: :.:: ::: NP_002 MSLRLQSSSASYGGGFGGGSCQ----LGGG--RGVST------CSTRFVSGG 10 20 30 40 70 80 90 100 110 pF1KE4 -ACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAGFGGGLGAGFGGGFAGG--------DG : : ::: . ::.... :::::::::::::.:.:::::.::::::::: : NP_002 SAGGYGGGVSCGFGGGA--GSGFGGGYGGGLGGGYGGGLGGGFGGGFAGGFVDFGACDGG 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 LLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWYQRQRP-SEIKDYSPYFKT ::.:.::.:::::::::::::.:::::::::::::::::::. .: : : .:::::.:: NP_002 LLTGNEKITMQNLNDRLASYLEKVRALEEANADLEVKIRDWHLKQSPASPERDYSPYYKT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 IEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHELALRQTVEADVNGLRRVLDEL ::.::.::..::::: . ::.:::::::::::: :::.::::::.::::.:::::::::: NP_002 IEELRDKILTATIENNRVILEIDNARLAADDFRLKYENELALRQSVEADINGLRRVLDEL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 TLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDVNVEMDAAPGVDLSRILNEMR ::..::::::::.:.:::::..::::::: . .:. :.:::::::.::.::.:.: ::: NP_002 TLSKTDLEMQIESLNEELAYMKKNHEEEMKEFSNQVVGQVNVEMDATPGIDLTRVLAEMR 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 DQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSRSEVTELRRVLQGLEIELQSQ .::: :::.:::::: :: .:. ::::::..:. ..:.:..:.:::::.::::::::::: NP_002 EQYEAMAERNRRDAEEWFHAKSAELNKEVSTNTAMIQTSKTEITELRRTLQGLEIELQSQ 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 LSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLRCEMEQQSQEYQILLDVKTRL :::::.:::.. ::. :: .::.::::::.:.: ::..:: ::: :.:::..:::.:::: NP_002 LSMKAGLENTVAETECRYALQLQQIQGLISSIEAQLSELRSEMECQNQEYKMLLDIKTRL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 EQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSSSSRQTRPILKEQSSSSFSQG :::::::: ::::.:: NP_002 EQEIATYRSLLEGQDAKKRQPP 400 410 420 >>NP_000412 (OMIM: 113800,148080,607602,609165) keratin, (584 aa) initn: 1321 init1: 1157 opt: 1644 Z-score: 941.0 bits: 183.8 E(85289): 1.1e-45 Smith-Waterman score: 1644; 60.8% identity (81.9% similar) in 452 aa overlap (12-452:37-483) 10 20 30 pF1KE4 MTTCSRQFTSSSSMKGSCGIG---GGIGGGS-SRISSVLAG :: ::: : : ::..::: :: :: : NP_000 SSKHYSSSRSGGGGGGGGCGGGGGVSSLRISSSKGSLGGGFSSGGFSGGSFSRGSS---G 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 GSCRAPST--YGG--GLSVSSRFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAG :.: . :. ::: :.. .: .: :. ..::.:::.:...: :..:::: :: : : NP_000 GGCFGGSSGGYGGLGGFGGGSFRGSYGSSSFGGSYGGSFGGGSFGGGSFGGGSFGGGGFG 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 FGGGLGAGFGGGFAGGDGLLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWY :::.:.::::::.: ::: :.::::::::::::::::::::::::.: .:: ::..:: NP_000 -GGGFGGGFGGGFGGDGGLLSGNEKVTMQNLNDRLASYLDKVRALEESNYELEGKIKEWY 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE4 QRQRPS---EIKDYSPYFKTIEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHEL ... : : .::: :.:::.::.:.:. : .::. .:::::::::::::: :::.:. NP_000 EKHGNSHQGEPRDYSKYYKTIDDLKNQILNLTTDNANILLQIDNARLAADDFRLKYENEV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE4 ALRQTVEADVNGLRRVLDELTLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDV ::::.::::.::::::::::::...:::::::.: ::::::.::::::: ::. . ::: NP_000 ALRQSVEADINGLRRVLDELTLTKADLEMQIESLTEELAYLKKNHEEEMKDLRNVSTGDV 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE4 NVEMDAAPGVDLSRILNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSR ::::.:::::::...::.::.::::.::.::.:::.:: :..::. :. .: : ..: . NP_000 NVEMNAAPGVDLTQLLNNMRSQYEQLAEQNRKDAEAWFNEKSKELTTEIDNNIEQISSYK 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE4 SEVTELRRVLQGLEIELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLR ::.::::: .:.:::::::::..: ::: :: ::.::::.::::::. :...:::: :.: NP_000 SEITELRRNVQALEIELQSQLALKQSLEASLAETEGRYCVQLSQIQAQISALEEQLQQIR 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE4 CEMEQQSQEYQILLDVKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSS : : :. ::: :::.: :::.:: ::: ::::: . .. ...: :... ::... NP_000 AETECQNTEYQQLLDIKIRLENEIQTYRSLLEGEGSSGGGGRGGG-SFGGGYGGGSSGGG 430 440 450 460 470 480 460 470 pF1KE4 SSRQTRPILKEQSSSSFSQGQSS :: NP_000 SSGGGHGGGHGGSSGGGYGGGSSGGGSSGGGYGGGSSSGGHGGSSSGGYGGGSSGGGGGG 490 500 510 520 530 540 >>XP_005257400 (OMIM: 113800,148080,607602,609165) PREDI (624 aa) initn: 1317 init1: 1157 opt: 1640 Z-score: 938.5 bits: 183.4 E(85289): 1.6e-45 Smith-Waterman score: 1640; 60.8% identity (81.6% similar) in 452 aa overlap (12-452:37-483) 10 20 30 pF1KE4 MTTCSRQFTSSSSMKGSCGIG---GGIGGGS-SRISSVLAG :: ::: : : ::..::: :: :: : XP_005 SSKHYSSSRSGGGGGGGGCGGGGGVSSLRISSSKGSLGGGFSSGGFSGGSFSRGSS---G 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 GSCRAPST--YGG--GLSVSSRFSSGGACGLGGGYGGGFSSSSSFGSGFGGGYGGGLGAG :.: . :. ::: :.. .: .: :. ..::.::: :...: :..:::: :: : : XP_005 GGCFGGSSGGYGGLGGFGGGSFRGSYGSSSFGGSYGGIFGGGSFGGGSFGGGSFGGGGFG 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 FGGGLGAGFGGGFAGGDGLLVGSEKVTMQNLNDRLASYLDKVRALEEANADLEVKIRDWY :::.:.::::::.: ::: :.::::::::::::::::::::::::.: .:: ::..:: XP_005 -GGGFGGGFGGGFGGDGGLLSGNEKVTMQNLNDRLASYLDKVRALEESNYELEGKIKEWY 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE4 QRQRPS---EIKDYSPYFKTIEDLRNKIIAATIENAQPILQIDNARLAADDFRTKYEHEL ... : : .::: :.:::.::.:.:. : .::. .:::::::::::::: :::.:. XP_005 EKHGNSHQGEPRDYSKYYKTIDDLKNQILNLTTDNANILLQIDNARLAADDFRLKYENEV 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE4 ALRQTVEADVNGLRRVLDELTLARTDLEMQIEGLKEELAYLRKNHEEEMLALRGQTGGDV ::::.::::.::::::::::::...:::::::.: ::::::.::::::: ::. . ::: XP_005 ALRQSVEADINGLRRVLDELTLTKADLEMQIESLTEELAYLKKNHEEEMKDLRNVSTGDV 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE4 NVEMDAAPGVDLSRILNEMRDQYEQMAEKNRRDAETWFLSKTEELNKEVASNSELVQSSR ::::.:::::::...::.::.::::.::.::.:::.:: :..::. :. .: : ..: . XP_005 NVEMNAAPGVDLTQLLNNMRSQYEQLAEQNRKDAEAWFNEKSKELTTEIDNNIEQISSYK 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE4 SEVTELRRVLQGLEIELQSQLSMKASLENSLEETKGRYCMQLSQIQGLIGSVEEQLAQLR ::.::::: .:.:::::::::..: ::: :: ::.::::.::::::. :...:::: :.: XP_005 SEITELRRNVQALEIELQSQLALKQSLEASLAETEGRYCVQLSQIQAQISALEEQLQQIR 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE4 CEMEQQSQEYQILLDVKTRLEQEIATYRRLLEGEDAHLSSQQASGQSYSSREVFTSSSSS : : :. ::: :::.: :::.:: ::: ::::: . .. ...: :... ::... XP_005 AETECQNTEYQQLLDIKIRLENEIQTYRSLLEGEGSSGGGGRGGG-SFGGGYGGGSSGGG 430 440 450 460 470 480 460 470 pF1KE4 SSRQTRPILKEQSSSSFSQGQSS :: XP_005 SSGGGHGGGHGGSSGGGYGGGSSGGGSSGGGYGGGSSSGGHGGSSSGGYGGGSSGGGGGG 490 500 510 520 530 540 473 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:01:46 2016 done: Sun Nov 6 01:01:48 2016 Total Scan time: 10.420 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]