FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1575, 365 aa 1>>>pF1KE1575 365 - 365 aa - 365 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2621+/-0.000846; mu= 17.5240+/- 0.051 mean_var=79.8738+/-15.791, 0's: 0 Z-trim(108.0): 65 B-trim: 3 in 1/51 Lambda= 0.143507 statistics sampled from 9838 (9905) to 9838 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.678), E-opt: 0.2 (0.304), width: 16 Scan time: 2.420 The best scores are: opt bits E(32554) CCDS34373.1 A gene_id:3105|Hs108|chr6 ( 365) 2276 480.7 8.4e-136 CCDS34394.1 B gene_id:3106|Hs108|chr6 ( 362) 2095 443.3 1.6e-124 CCDS34393.1 C gene_id:3107|Hs108|chr6 ( 366) 1997 423.0 2.1e-118 CCDS43437.1 F gene_id:3134|Hs108|chr6 ( 442) 1904 403.8 1.5e-112 CCDS43438.1 F gene_id:3134|Hs108|chr6 ( 346) 1895 401.8 4.5e-112 CCDS34379.1 E gene_id:3133|Hs108|chr6 ( 358) 1870 396.7 1.7e-110 CCDS4668.1 G gene_id:3135|Hs108|chr6 ( 338) 1866 395.8 2.8e-110 CCDS43439.1 F gene_id:3134|Hs108|chr6 ( 254) 1045 225.7 3.3e-59 CCDS1342.1 MR1 gene_id:3140|Hs108|chr1 ( 341) 816 178.4 7.8e-45 CCDS4578.1 HFE gene_id:3077|Hs108|chr6 ( 348) 737 162.1 6.7e-40 CCDS75412.1 HFE gene_id:3077|Hs108|chr6 ( 337) 730 160.6 1.8e-39 CCDS47387.1 HFE gene_id:3077|Hs108|chr6 ( 325) 688 151.9 7.2e-37 CCDS5680.1 AZGP1 gene_id:563|Hs108|chr7 ( 298) 675 149.2 4.3e-36 CCDS4580.1 HFE gene_id:3077|Hs108|chr6 ( 260) 571 127.6 1.2e-29 CCDS53440.1 MR1 gene_id:3140|Hs108|chr1 ( 249) 543 121.8 6.4e-28 CCDS53441.1 MR1 gene_id:3140|Hs108|chr1 ( 214) 530 119.1 3.7e-27 CCDS56412.1 MICA gene_id:100507436|Hs108|chr6 ( 332) 514 115.9 5.1e-26 CCDS43449.1 MICB gene_id:4277|Hs108|chr6 ( 383) 482 109.3 5.6e-24 CCDS75423.1 MICB gene_id:4277|Hs108|chr6 ( 351) 454 103.5 2.9e-22 CCDS53442.1 MR1 gene_id:3140|Hs108|chr1 ( 296) 452 103.0 3.4e-22 CCDS12770.1 FCGRT gene_id:2217|Hs108|chr19 ( 365) 423 97.1 2.6e-20 CCDS4581.1 HFE gene_id:3077|Hs108|chr6 ( 168) 380 87.9 6.8e-18 CCDS4579.1 HFE gene_id:3077|Hs108|chr6 ( 256) 380 88.1 9.4e-18 CCDS75421.1 MICA gene_id:100507436|Hs108|chr6 ( 235) 374 86.8 2.1e-17 CCDS54975.1 HFE gene_id:3077|Hs108|chr6 ( 246) 369 85.8 4.4e-17 CCDS54974.1 HFE gene_id:3077|Hs108|chr6 ( 334) 369 85.9 5.6e-17 CCDS47386.1 HFE gene_id:3077|Hs108|chr6 ( 242) 359 83.7 1.8e-16 CCDS1174.1 CD1A gene_id:909|Hs108|chr1 ( 327) 313 74.3 1.7e-13 CCDS75422.1 MICB gene_id:4277|Hs108|chr6 ( 340) 296 70.8 2e-12 >>CCDS34373.1 A gene_id:3105|Hs108|chr6 (365 aa) initn: 2276 init1: 2276 opt: 2276 Z-score: 2551.6 bits: 480.7 E(32554): 8.4e-136 Smith-Waterman score: 2276; 91.2% identity (96.2% similar) in 365 aa overlap (1-365:1-365) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF :::::::::.::::::::::::::::::::::.::::::::::::::::::::::::::: CCDS34 MAVMAPRTLLLLLSGALALTQTWAGSHSMRYFFTSVSRPGRGEPRFIAVGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ :::::::::::::::::::::::::..::::::.::::: .: :::::: :::::: CCDS34 DSDAASQRMEPRAPWIEQEGPEYWDQETRNVKAQSQTDRVDLGTLRGYYNQSEAGSHTIQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW ::::::: ::::::::.:::::::::::::::::::::::::::::.::::.:::::: CCDS34 IMYGCDVGSDGRFLRGYRQDAYDGKDYIALNEDLRSWTAADMAAQITKRKWEAAHEAEQL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT ::::.: :::::::::::::::::::: :::::::: .::::::::::::.::::::::: CCDS34 RAYLDGTCVEWLRRYLENGKETLQRTDPPKTHMTHHPISDHEATLRCWALGFYPAEITLT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP :::::::::::::::::::::::::::::.::::::.:::::::::::::::::::::: CCDS34 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPKPLTLRWEL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL :::::::::::::::::.::::.:::::::::::::::::::::.::::::::::::.:: CCDS34 SSQPTIPIVGIIAGLVLLGAVITGAVVAAVMWRRKSSDRKGGSYTQAASSDSAQGSDVSL 310 320 330 340 350 360 pF1KE1 TACKV ::::: CCDS34 TACKV >>CCDS34394.1 B gene_id:3106|Hs108|chr6 (362 aa) initn: 2095 init1: 2095 opt: 2095 Z-score: 2349.1 bits: 443.3 E(32554): 1.6e-124 Smith-Waterman score: 2095; 84.5% identity (93.4% similar) in 362 aa overlap (1-362:1-362) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF : ::::::..::::.:::::.::::::::::::::::::::::::::.:::::::::::: CCDS34 MLVMAPRTVLLLLSAALALTETWAGSHSMRYFYTSVSRPGRGEPRFISVGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ :::::: : :::::::::::::::::::. ::..:::::::: :::::: ::::.: CCDS34 DSDAASPREEPRAPWIEQEGPEYWDRNTQIYKAQAQTDRESLRNLRGYYNQSEAGSHTLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW :::::::::::.:::..: ::::::::::::::::::::: ::::::::::.:.:::: CCDS34 SMYGCDVGPDGRLLRGHDQYAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAAREAEQR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT ::::::.:::::::::::::. :.:.: ::::.::: .::::::::::::.::::::::: CCDS34 RAYLEGECVEWLRRYLENGKDKLERADPPKTHVTHHPISDHEATLRCWALGFYPAEITLT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP :::::::::::::::::::::: ::::::.::::::.::::::::::::::::::::::: CCDS34 WQRDGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEEQRYTCHVQHEGLPKPLTLRWEP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL ::: :.:::::.:::.....:. :::::::: ::::: ::::::::: ::::::::.:: CCDS34 SSQSTVPIVGIVAGLAVLAVVVIGAVVAAVMCRRKSSGGKGGSYSQAACSDSAQGSDVSL 310 320 330 340 350 360 pF1KE1 TACKV :: CCDS34 TA >>CCDS34393.1 C gene_id:3107|Hs108|chr6 (366 aa) initn: 1909 init1: 1828 opt: 1997 Z-score: 2239.4 bits: 423.0 E(32554): 2.1e-118 Smith-Waterman score: 1997; 80.8% identity (90.7% similar) in 365 aa overlap (1-364:1-365) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF : :::::.:.:::::.::::.::: ::::::: :.::::::::::::.:::::::::::: CCDS34 MRVMAPRALLLLLSGGLALTETWACSHSMRYFDTAVSRPGRGEPRFISVGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ :::::: : ::::::.::::::::::.:.. : ..:.:: ::: :::::::::::.: CCDS34 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQADRVSLRNLRGYYNQSEDGSHTLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW :: :::.:::::.::::.:.::::::::::::::::::::: :::::::: :.:. ::: CCDS34 RMSGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKLEAARAAEQL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT :::::: ::::::::::::::::::.. ::::.::: .::::::::::::.::::::::: CCDS34 RAYLEGTCVEWLRRYLENGKETLQRAEPPKTHVTHHPLSDHEATLRCWALGFYPAEITLT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP :::::::::::::::::::::::::::::.::::::::::::::.::::: .:::: ::: CCDS34 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGQEQRYTCHMQHEGLQEPLTLSWEP 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 SSQPTIPIVGIIAGL-VLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMS ::::::::.::.::: :: .. ::::.:.: ::::: :::: :::: :.:::::: : CCDS34 SSQPTIPIMGIVAGLAVLVVLAVLGAVVTAMMCRRKSSGGKGGSCSQAACSNSAQGSDES 310 320 330 340 350 360 360 pF1KE1 LTACKV : .:: CCDS34 LITCKA >>CCDS43437.1 F gene_id:3134|Hs108|chr6 (442 aa) initn: 1932 init1: 1904 opt: 1904 Z-score: 2134.2 bits: 403.8 E(32554): 1.5e-112 Smith-Waterman score: 1904; 76.9% identity (91.3% similar) in 355 aa overlap (4-358:1-355) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF ::::.:.::::::::::.:::::::.::: :.::::::::::.::: :::::::.:: CCDS43 MAPRSLLLLLSGALALTDTWAGSHSLRYFSTAVSRPGRGEPRYIAVEYVDDTQFLRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ ::::: ::::: ::.:::::.::. .: .::..:::: .:: :: ::::: ::::.: CCDS43 DSDAAIPRMEPREPWVEQEGPQYWEWTTGYAKANAQTDRVALRNLLRRYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW : :::.:::::.::::.: ::::::::.:::::::::::: .:::::: .:. . ::.. CCDS43 GMNGCDMGPDGRLLRGYHQHAYDGKDYISLNEDLRSWTAADTVAQITQRFYEAEEYAEEF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT :.::::.:.: ::::::::::::::.: ::.:..:: .::::::::::::.::::::::: CCDS43 RTYLEGECLELLRRYLENGKETLQRADPPKAHVAHHPISDHEATLRCWALGFYPAEITLT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP ::::::.::::::::::::::::::::::.:::: :.::::::::::::::.:: :::: CCDS43 WQRDGEEQTQDTELVETRPAGDGTFQKWAAVVVPPGEEQRYTCHVQHEGLPQPLILRWEQ 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL : :::::::::.::::..:::..::::::::::.:::::. :::::::. . ..:. : CCDS43 SPQPTIPIVGIVAGLVVLGAVVTGAVVAAVMWRKKSSDRNRGSYSQAAAYSVVSGNLMIT 300 310 320 330 340 350 pF1KE1 TACKV CCDS43 WWSSLFLLGVLFQGYLGCLRSHSVLGRRKVGDMWILFFLWLWTSFNTAFLALQSLRFGFG 360 370 380 390 400 410 >>CCDS43438.1 F gene_id:3134|Hs108|chr6 (346 aa) initn: 1895 init1: 1895 opt: 1895 Z-score: 2125.6 bits: 401.8 E(32554): 4.5e-112 Smith-Waterman score: 1895; 78.6% identity (91.9% similar) in 345 aa overlap (4-348:1-345) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF ::::.:.::::::::::.:::::::.::: :.::::::::::.::: :::::::.:: CCDS43 MAPRSLLLLLSGALALTDTWAGSHSLRYFSTAVSRPGRGEPRYIAVEYVDDTQFLRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ ::::: ::::: ::.:::::.::. .: .::..:::: .:: :: ::::: ::::.: CCDS43 DSDAAIPRMEPREPWVEQEGPQYWEWTTGYAKANAQTDRVALRNLLRRYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW : :::.:::::.::::.: ::::::::.:::::::::::: .:::::: .:. . ::.. CCDS43 GMNGCDMGPDGRLLRGYHQHAYDGKDYISLNEDLRSWTAADTVAQITQRFYEAEEYAEEF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT :.::::.:.: ::::::::::::::.: ::.:..:: .::::::::::::.::::::::: CCDS43 RTYLEGECLELLRRYLENGKETLQRADPPKAHVAHHPISDHEATLRCWALGFYPAEITLT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP ::::::.::::::::::::::::::::::.:::: :.::::::::::::::.:: :::: CCDS43 WQRDGEEQTQDTELVETRPAGDGTFQKWAAVVVPPGEEQRYTCHVQHEGLPQPLILRWEQ 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL : :::::::::.::::..:::..::::::::::.:::::. ::::::: CCDS43 SPQPTIPIVGIVAGLVVLGAVVTGAVVAAVMWRKKSSDRNRGSYSQAAV 300 310 320 330 340 pF1KE1 TACKV >>CCDS34379.1 E gene_id:3133|Hs108|chr6 (358 aa) initn: 1891 init1: 1867 opt: 1870 Z-score: 2097.4 bits: 396.7 E(32554): 1.7e-110 Smith-Waterman score: 1870; 76.0% identity (90.4% similar) in 354 aa overlap (4-357:1-354) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF :. ::.:::: :::::::::::::..::.::::::::::::::.:::::::::::: CCDS34 MVDGTLLLLLSEALALTQTWAGSHSLKYFHTSVSRPGRGEPRFISVGYVDDTQFVRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ :.:::: :: :::::.:::: :::::.::... .: : .:: :::::: ::::.: CCDS34 DNDAASPRMVPRAPWMEQEGSEYWDRETRSARDTAQIFRVNLRTLRGYYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW :.::..::::::::::.: :::::::..::::::::::.: ::::...: . : :::. CCDS34 WMHGCELGPDGRFLRGYEQFAYDGKDYLTLNEDLRSWTAVDTAAQISEQKSNDASEAEHQ 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT ::::: :::::..:::.::::: . . ::::.::: .::::::::::::.::::::::: CCDS34 RAYLEDTCVEWLHKYLEKGKETLLHLEPPKTHVTHHPISDHEATLRCWALGFYPAEITLT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP ::.::: .:::::::::::::::::::::.::::::.::::::::::::::.:.::::.: CCDS34 WQQDGEGHTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPVTLRWKP 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL .::::::::::::::::.:.:..:::::::.::.::: ::::::.: :::::::. CCDS34 ASQPTIPIVGIIAGLVLLGSVVSGAVVAAVIWRKKSSGGKGGSYSKAEWSDSAQGSESHS 300 310 320 330 340 350 pF1KE1 TACKV CCDS34 L >>CCDS4668.1 G gene_id:3135|Hs108|chr6 (338 aa) initn: 1866 init1: 1866 opt: 1866 Z-score: 2093.3 bits: 395.8 E(32554): 2.8e-110 Smith-Waterman score: 1866; 78.7% identity (92.0% similar) in 338 aa overlap (1-338:1-338) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF :.::::::: :::::::.::.::::::::::: ..:::::::::::::.::::::::::: CCDS46 MVVMAPRTLFLLLSGALTLTETWAGSHSMRYFSAAVSRPGRGEPRFIAMGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ :::.: ::::::::.::::::::...:::.:::.:::: .:. :::::: .:::.: CCDS46 DSDSACPRMEPRAPWVEQEGPEYWEEETRNTKAHAQTDRMNLQTLRGYYNQSEASSHTLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW : :::.: :::.::::.: :::::::.::::::::::::: ::::..:: :.:. ::: CCDS46 WMIGCDLGSDGRLLRGYEQYAYDGKDYLALNEDLRSWTAADTAAQISKRKCEAANVAEQR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT :::::: :::::.:::::::: :::.: ::::.::: : :.:::::::::.:::::: :: CCDS46 RAYLEGTCVEWLHRYLENGKEMLQRADPPKTHVTHHPVFDYEATLRCWALGFYPAEIILT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP :::::::::::.:::::::::::::::::.::::::.::::::::::::::.:: :::. CCDS46 WQRDGEDQTQDVELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLMLRWKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL :: :::::.::.::::...::..::.::::.::.:::: CCDS46 SSLPTIPIMGIVAGLVVLAAVVTGAAVAAVLWRKKSSD 310 320 330 pF1KE1 TACKV >>CCDS43439.1 F gene_id:3134|Hs108|chr6 (254 aa) initn: 1072 init1: 1044 opt: 1045 Z-score: 1176.3 bits: 225.7 E(32554): 3.3e-59 Smith-Waterman score: 1109; 55.7% identity (66.4% similar) in 345 aa overlap (4-348:1-253) 10 20 30 40 50 60 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVRF ::::.:.::::::::::.:::::::.::: :.::::::::::.::: :::::::.:: CCDS43 MAPRSLLLLLSGALALTDTWAGSHSLRYFSTAVSRPGRGEPRYIAVEYVDDTQFLRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASQRMEPRAPWIEQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHTIQ ::::: ::::: ::.:::::.::. .: .::..:::: .:: :: ::::: ::::.: CCDS43 DSDAAIPRMEPREPWVEQEGPQYWEWTTGYAKANAQTDRVALRNLLRRYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 RMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAHEAEQW : :::.:::::.::::.: ::::::::.:::::::::::: .:::::: .:. . ::.. CCDS43 GMNGCDMGPDGRLLRGYHQHAYDGKDYISLNEDLRSWTAADTVAQITQRFYEAEEYAEEF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLT :.::::.:.: ::::::::::::::. CCDS43 RTYLEGECLELLRRYLENGKETLQRA---------------------------------- 180 190 200 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPLTLRWEP : CCDS43 ----------------------------------------------------------EQ 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQGSDMSL : :::::::::.::::..:::..::::::::::.:::::. ::::::: CCDS43 SPQPTIPIVGIVAGLVVLGAVVTGAVVAAVMWRKKSSDRNRGSYSQAAV 210 220 230 240 250 pF1KE1 TACKV >>CCDS1342.1 MR1 gene_id:3140|Hs108|chr1 (341 aa) initn: 720 init1: 401 opt: 816 Z-score: 918.4 bits: 178.4 E(32554): 7.8e-45 Smith-Waterman score: 823; 37.5% identity (68.0% similar) in 347 aa overlap (1-344:5-335) 10 20 30 40 50 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQ :: . : .::... .. . .::.::: .:: : .: :.::.:::::. CCDS13 MGELMAFLLPLIIVLMVK------HSDSRTHSLRYFRLGVSDPIHGVPEFISVGYVDSHP 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 FVRFDSDAASQRMEPRAPWI-EQEGPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDG .. .:: .... ::::::. :. .:..:.: :. ... .: . :. :.::.: : CCDS13 ITTYDS--VTRQKEPRAPWMAENLAPDHWERYTQLLRGWQQMFKVELKRLQRHYNHS--G 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 SHTIQRMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETA- ::: ::: ::.. :: :. : ::::.:.. .:.: :: :.: .:. .. ::. CCDS13 SHTYQRMIGCELLEDGS-TTGFLQYAYDGQDFLIFNKDTLSWLAVDNVAHTIKQAWEANQ 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 HEAEQWRAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYP :: . .:: .:. ::.:.:: ::.:::::. : ...... . ..: : : .::: CCDS13 HELLYQKNWLEEECIAWLKRFLEYGKDTLQRTEPPLVRVNRKETFPGVTALFCKAHGFYP 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE1 AEITLTWQRDGEDQTQDTELVETRPAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPL :: .::...::. .:. . . :.::::.: :::. . . . :.:::.: :. : CCDS13 PEIYMTWMKNGEEIVQEIDYGDILPSGDGTYQAWASIELDPQSSNLYSCHVEHCGVHMVL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 TLRWEPSSQPTIPIV-GIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSA . :. . :::.: ..: ... :.:: :....:::. ...:. : CCDS13 QV---PQESETIPLVMKAVSGSIVLVIVLAG--VGVLVWRRRPREQNGAIYLPTPDR 290 300 310 320 330 340 360 pF1KE1 QGSDMSLTACKV >>CCDS4578.1 HFE gene_id:3077|Hs108|chr6 (348 aa) initn: 518 init1: 274 opt: 737 Z-score: 829.9 bits: 162.1 E(32554): 6.7e-40 Smith-Waterman score: 737; 35.2% identity (66.3% similar) in 347 aa overlap (6-347:7-345) 10 20 30 40 50 pF1KE1 MAVMAPRTLVLLLSGALALTQTWAGSHSMRYFYTSVSRPGRGEPRFIAVGYVDDTQFVR : :.:.: . .: :::..:.. ..:. : : :.::::: :: CCDS45 MGPRARPALLLLMLLQTAVLQGRLLRSHSLHYLFMGASEQDLGLSLFEALGYVDDQLFVF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 FDSDAASQRMEPRAPWIEQE-GPEYWDRNTRNVKAHSQTDRESLRIALRYYNQSEDGSHT .: . :.:.:::.::. .. . ..: . ....:. .. .. .. .:.:.. ::: CCDS45 YDHE--SRRVEPRTPWVSSRISSQMWLQLSQSLKGWDHMFTVDFWTIMENHNHSKE-SHT 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 IQRMYGCDVGPDGRFLRGYQQDAYDGKDYIALNEDLRSWTAADMAAQITQRKWETAH-EA .: . ::.. :. .:: . .:::.:.. . : .: ::. : :. .:: . .: CCDS45 LQVILGCEMQEDNS-TEGYWKYGYDGQDHLEFCPDTLDWRAAEPRAWPTKLEWERHKIRA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 EQWRAYLEGRCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEI .: ::::: : :.. :: :. .:.. : ...::: :.. .:::: ::..:: .: CCDS45 RQNRAYLERDCPAQLQQLLELGRGVLDQQVPPLVKVTHH-VTSSVTTLRCRALNYYPQNI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 TLTWQRDGEDQTQDTELVETR---PAGDGTFQKWASVVVPSGQEQRYTCHVQHEGLPKPL :. : .: : .:.. : . : ::::.: : ...:: :.::::::.:.: :: .:: CCDS45 TMKWLKD--KQPMDAKEFEPKDVLPNGDGTYQGWITLAVPPGEEQRYTCQVEHPGLDQPL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 TLRWEPSSQPTIPIVGIIAGLVLFGAVIAGAVVAAVMWRRKSSDRKGGSYSQAASSDSAQ . :::: . :. ..:.:.:...: ... ... .. .:..: : : : CCDS45 IVIWEPSPSGTL-VIGVISGIAVFVVILFIGILFIILRKRQGSRGAMGHYVLAERE 300 310 320 330 340 360 pF1KE1 GSDMSLTACKV 365 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 02:08:14 2016 done: Mon Nov 7 02:08:15 2016 Total Scan time: 2.420 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]