FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1509, 366 aa 1>>>pF1KE1509 366 - 366 aa - 366 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1038+/-0.000743; mu= 18.6293+/- 0.045 mean_var=85.1561+/-16.778, 0's: 0 Z-trim(110.3): 74 B-trim: 7 in 1/51 Lambda= 0.138984 statistics sampled from 11398 (11477) to 11398 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.722), E-opt: 0.2 (0.353), width: 16 Scan time: 1.480 The best scores are: opt bits E(32554) CCDS34393.1 C gene_id:3107|Hs108|chr6 ( 366) 2322 475.2 3.9e-134 CCDS34394.1 B gene_id:3106|Hs108|chr6 ( 362) 2191 448.9 3.2e-126 CCDS34373.1 A gene_id:3105|Hs108|chr6 ( 365) 2096 429.9 1.7e-120 CCDS4668.1 G gene_id:3135|Hs108|chr6 ( 338) 1908 392.1 3.6e-109 CCDS34379.1 E gene_id:3133|Hs108|chr6 ( 358) 1895 389.6 2.3e-108 CCDS43437.1 F gene_id:3134|Hs108|chr6 ( 442) 1855 381.6 6.9e-106 CCDS43438.1 F gene_id:3134|Hs108|chr6 ( 346) 1848 380.1 1.5e-105 CCDS43439.1 F gene_id:3134|Hs108|chr6 ( 254) 1074 224.8 6.5e-59 CCDS1342.1 MR1 gene_id:3140|Hs108|chr1 ( 341) 784 166.8 2.6e-41 CCDS4578.1 HFE gene_id:3077|Hs108|chr6 ( 348) 759 161.8 8.4e-40 CCDS75412.1 HFE gene_id:3077|Hs108|chr6 ( 337) 750 159.9 2.9e-39 CCDS47387.1 HFE gene_id:3077|Hs108|chr6 ( 325) 711 152.1 6.3e-37 CCDS5680.1 AZGP1 gene_id:563|Hs108|chr7 ( 298) 666 143.0 3.1e-34 CCDS4580.1 HFE gene_id:3077|Hs108|chr6 ( 260) 600 129.8 2.7e-30 CCDS53440.1 MR1 gene_id:3140|Hs108|chr1 ( 249) 530 115.7 4.4e-26 CCDS53441.1 MR1 gene_id:3140|Hs108|chr1 ( 214) 529 115.4 4.5e-26 CCDS43449.1 MICB gene_id:4277|Hs108|chr6 ( 383) 506 111.1 1.7e-24 CCDS56412.1 MICA gene_id:100507436|Hs108|chr6 ( 332) 499 109.6 4e-24 CCDS75423.1 MICB gene_id:4277|Hs108|chr6 ( 351) 476 105.0 1e-22 CCDS12770.1 FCGRT gene_id:2217|Hs108|chr19 ( 365) 432 96.2 4.7e-20 CCDS53442.1 MR1 gene_id:3140|Hs108|chr1 ( 296) 427 95.1 8.2e-20 CCDS4579.1 HFE gene_id:3077|Hs108|chr6 ( 256) 412 92.1 5.9e-19 CCDS4581.1 HFE gene_id:3077|Hs108|chr6 ( 168) 399 89.3 2.7e-18 CCDS54975.1 HFE gene_id:3077|Hs108|chr6 ( 246) 384 86.4 2.8e-17 CCDS54974.1 HFE gene_id:3077|Hs108|chr6 ( 334) 384 86.6 3.5e-17 CCDS47386.1 HFE gene_id:3077|Hs108|chr6 ( 242) 371 83.8 1.7e-16 CCDS75421.1 MICA gene_id:100507436|Hs108|chr6 ( 235) 360 81.6 7.7e-16 CCDS75422.1 MICB gene_id:4277|Hs108|chr6 ( 340) 327 75.1 9.8e-14 CCDS1174.1 CD1A gene_id:909|Hs108|chr1 ( 327) 298 69.3 5.4e-12 >>CCDS34393.1 C gene_id:3107|Hs108|chr6 (366 aa) initn: 2322 init1: 2322 opt: 2322 Z-score: 2521.5 bits: 475.2 E(32554): 3.9e-134 Smith-Waterman score: 2322; 93.2% identity (97.0% similar) in 366 aa overlap (1-366:1-366) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF :::::::.:.:::::.:::::::::::::::: ::::::::::::::.:::::::::::: CCDS34 MRVMAPRALLLLLSGGLALTETWACSHSMRYFDTAVSRPGRGEPRFISVGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ ::::::::::::::::::::::::::::::::::::.:::::::::::::::: :::::: CCDS34 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQADRVSLRNLRGYYNQSEDGSHTLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ : ::::::::::::::::::::::::::::::::::::::::::::::: :::::::: CCDS34 RMSGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKLEAARAAEQL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT ::::::::::::::::::::::::::: :::::::: .:::::::::::::::::::::: CCDS34 RAYLEGTCVEWLRRYLENGKETLQRAEPPKTHVTHHPLSDHEATLRCWALGFYPAEITLT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP ::::::::::::::::::::::::::::::::::::.:::::::.::::: ::::: ::: CCDS34 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGQEQRYTCHMQHEGLQEPLTLSWEP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES ::::::::.:::::::::.:::::::::...:::::::::::::::::: :::::::::: CCDS34 SSQPTIPIMGIVAGLAVLVVLAVLGAVVTAMMCRRKSSGGKGGSCSQAACSNSAQGSDES 310 320 330 340 350 360 pF1KE1 LIACKA ::.::: CCDS34 LITCKA >>CCDS34394.1 B gene_id:3106|Hs108|chr6 (362 aa) initn: 2249 init1: 2008 opt: 2191 Z-score: 2379.6 bits: 448.9 E(32554): 3.2e-126 Smith-Waterman score: 2191; 89.0% identity (94.5% similar) in 363 aa overlap (1-363:1-362) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF : ::::::..::::.::::::::: :::::::::.::::::::::::.:::::::::::: CCDS34 MLVMAPRTVLLLLSAALALTETWAGSHSMRYFYTSVSRPGRGEPRFISVGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ :::::::: ::::::.::::::::::.:: :: :::::: :::::::::::::::::::: CCDS34 DSDAASPREEPRAPWIEQEGPEYWDRNTQIYKAQAQTDRESLRNLRGYYNQSEAGSHTLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ :::::.:::::::::.:: ::::::::::::::::::::::::::::::::::: :::. CCDS34 SMYGCDVGPDGRLLRGHDQYAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAAREAEQR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT :::::: :::::::::::::. :.::. :::::::: .:::::::::::::::::::::: CCDS34 RAYLEGECVEWLRRYLENGKDKLERADPPKTHVTHHPISDHEATLRCWALGFYPAEITLT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP :::::::::::::::::::::: ::::::::::::::::::::::::::::.:::::::: CCDS34 WQRDGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEEQRYTCHVQHEGLPKPLTLRWEP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES ::: :.::::::::::::::. :.:::::.:::::::::::::: :::: :.:::::: : CCDS34 SSQSTVPIVGIVAGLAVLAVV-VIGAVVAAVMCRRKSSGGKGGSYSQAACSDSAQGSDVS 310 320 330 340 350 pF1KE1 LIACKA : : CCDS34 LTA 360 >>CCDS34373.1 A gene_id:3105|Hs108|chr6 (365 aa) initn: 1953 init1: 1927 opt: 2096 Z-score: 2276.7 bits: 429.9 E(32554): 1.7e-120 Smith-Waterman score: 2096; 84.4% identity (93.4% similar) in 365 aa overlap (1-365:1-364) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF : :::::::.::::::::::.::: :::::::.:.::::::::::::::::::::::::: CCDS34 MAVMAPRTLLLLLSGALALTQTWAGSHSMRYFFTSVSRPGRGEPRFIAVGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ :::::: : ::::::.:::::::::.::.. : :.:::::.: .::::::::::::::.: CCDS34 DSDAASQRMEPRAPWIEQEGPEYWDQETRNVKAQSQTDRVDLGTLRGYYNQSEAGSHTIQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ :::::.: :::.:::: :.::::::::::::::::::::: :::::.::::::. ::: CCDS34 IMYGCDVGSDGRFLRGYRQDAYDGKDYIALNEDLRSWTAADMAAQITKRKWEAAHEAEQL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT ::::.::::::::::::::::::::.. ::::.::: .:::::::::::::::::::::: CCDS34 RAYLDGTCVEWLRRYLENGKETLQRTDPPKTHMTHHPISDHEATLRCWALGFYPAEITLT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP :::::::::::::::::::::::::::::::::::::::::::::::::::.::::::: CCDS34 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPKPLTLRWEL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES :::::::::::.:::..:... . :::::.:: ::::: :::: .:::::.:::::: : CCDS34 SSQPTIPIVGIIAGLVLLGAV-ITGAVVAAVMWRRKSSDRKGGSYTQAASSDSAQGSDVS 310 320 330 340 350 pF1KE1 LIACKA : ::: CCDS34 LTACKV 360 >>CCDS4668.1 G gene_id:3135|Hs108|chr6 (338 aa) initn: 1926 init1: 1877 opt: 1908 Z-score: 2073.4 bits: 392.1 E(32554): 3.6e-109 Smith-Waterman score: 1908; 83.1% identity (93.2% similar) in 338 aa overlap (1-338:1-337) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF : :::::::.:::::::.:::::: ::::::: .::::::::::::::.::::::::::: CCDS46 MVVMAPRTLFLLLSGALTLTETWAGSHSMRYFSAAVSRPGRGEPRFIAMGYVDDTQFVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ :::.: :: :::::::::::::::..::.. : .:::::..:..::::::::::.::::: CCDS46 DSDSACPRMEPRAPWVEQEGPEYWEEETRNTKAHAQTDRMNLQTLRGYYNQSEASSHTLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ :: ::::: ::::::::.: :::::::.::::::::::::::::::..:: ::: .:::. CCDS46 WMIGCDLGSDGRLLRGYEQYAYDGKDYLALNEDLRSWTAADTAAQISKRKCEAANVAEQR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT ::::::::::::.:::::::: ::::. :::::::: : :.:::::::::::::::: :: CCDS46 RAYLEGTCVEWLHRYLENGKEMLQRADPPKTHVTHHPVFDYEATLRCWALGFYPAEIILT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP :::::::::::.:::::::::::::::::::::::::::::::::::::::::: :::. CCDS46 WQRDGEDQTQDVELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLMLRWKQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES :: :::::.::::::.:::.. : ::.::.:. :.::: CCDS46 SSLPTIPIMGIVAGLVVLAAV-VTGAAVAAVLWRKKSSD 310 320 330 pF1KE1 LIACKA >>CCDS34379.1 E gene_id:3133|Hs108|chr6 (358 aa) initn: 1799 init1: 1799 opt: 1895 Z-score: 2058.9 bits: 389.6 E(32554): 2.3e-108 Smith-Waterman score: 1895; 78.0% identity (91.5% similar) in 355 aa overlap (4-358:1-354) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF :. ::.:::: :::::.::: :::..::.:.::::::::::::.:::::::::::: CCDS34 MVDGTLLLLLSEALALTQTWAGSHSLKYFHTSVSRPGRGEPRFISVGYVDDTQFVRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ :.:::::: :::::.:::: :::::::.. . :: ::.::.:::::::::::::::: CCDS34 DNDAASPRMVPRAPWMEQEGSEYWDRETRSARDTAQIFRVNLRTLRGYYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ ::.::.::::::.::::.: :::::::..::::::::::.::::::...: . : ::.: CCDS34 WMHGCELGPDGRFLRGYEQFAYDGKDYLTLNEDLRSWTAVDTAAQISEQKSNDASEAEHQ 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT ::::: ::::::..:::.::::: . : :::::::: .:::::::::::::::::::::: CCDS34 RAYLEDTCVEWLHKYLEKGKETLLHLEPPKTHVTHHPISDHEATLRCWALGFYPAEITLT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP ::.::: .:::::::::::::::::::::::::::::::::::::::::::::.::::.: CCDS34 WQQDGEGHTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPVTLRWKP 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES .::::::::::.:::..:. . : :::::.:. :.::::::::: :.: :.:::::. CCDS34 ASQPTIPIVGIIAGLVLLGSV-VSGAVVAAVIWRKKSSGGKGGSYSKAEWSDSAQGSESH 300 310 320 330 340 350 pF1KE1 LIACKA CCDS34 SL >>CCDS43437.1 F gene_id:3134|Hs108|chr6 (442 aa) initn: 1966 init1: 1805 opt: 1855 Z-score: 2014.4 bits: 381.6 E(32554): 6.9e-106 Smith-Waterman score: 1855; 78.5% identity (88.7% similar) in 354 aa overlap (4-357:1-353) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF ::::.:.::::::::::.::: :::.::: ::::::::::::.::: :::::::.:: CCDS43 MAPRSLLLLLSGALALTDTWAGSHSLRYFSTAVSRPGRGEPRYIAVEYVDDTQFLRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ ::::: :: ::: ::::::::.::. : : .::::::.:::: :::::::::::: CCDS43 DSDAAIPRMEPREPWVEQEGPQYWEWTTGYAKANAQTDRVALRNLLRRYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ : :::.:::::::::: : ::::::::.:::::::::::::.:::::: .:: . ::. CCDS43 GMNGCDMGPDGRLLRGYHQHAYDGKDYISLNEDLRSWTAADTVAQITQRFYEAEEYAEEF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT :.:::: :.: :::::::::::::::. ::.::.:: .:::::::::::::::::::::: CCDS43 RTYLEGECLELLRRYLENGKETLQRADPPKAHVAHHPISDHEATLRCWALGFYPAEITLT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP ::::::.::::::::::::::::::::::::::: ::::::::::::::::.:: :::: CCDS43 WQRDGEEQTQDTELVETRPAGDGTFQKWAAVVVPPGEEQRYTCHVQHEGLPQPLILRWEQ 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES : :::::::::::::.::... : :::::.:: :.::: . :: ::::. . ..:. CCDS43 SPQPTIPIVGIVAGLVVLGAV-VTGAVVAAVMWRKKSSDRNRGSYSQAAAYSVVSGNLMI 300 310 320 330 340 350 pF1KE1 LIACKA CCDS43 TWWSSLFLLGVLFQGYLGCLRSHSVLGRRKVGDMWILFFLWLWTSFNTAFLALQSLRFGF 360 370 380 390 400 410 >>CCDS43438.1 F gene_id:3134|Hs108|chr6 (346 aa) initn: 1886 init1: 1782 opt: 1848 Z-score: 2008.2 bits: 380.1 E(32554): 1.5e-105 Smith-Waterman score: 1848; 80.1% identity (89.0% similar) in 346 aa overlap (4-349:1-345) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF ::::.:.::::::::::.::: :::.::: ::::::::::::.::: :::::::.:: CCDS43 MAPRSLLLLLSGALALTDTWAGSHSLRYFSTAVSRPGRGEPRYIAVEYVDDTQFLRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ ::::: :: ::: ::::::::.::. : : .::::::.:::: :::::::::::: CCDS43 DSDAAIPRMEPREPWVEQEGPQYWEWTTGYAKANAQTDRVALRNLLRRYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ : :::.:::::::::: : ::::::::.:::::::::::::.:::::: .:: . ::. CCDS43 GMNGCDMGPDGRLLRGYHQHAYDGKDYISLNEDLRSWTAADTVAQITQRFYEAEEYAEEF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEITLT :.:::: :.: :::::::::::::::. ::.::.:: .:::::::::::::::::::::: CCDS43 RTYLEGECLELLRRYLENGKETLQRADPPKAHVAHHPISDHEATLRCWALGFYPAEITLT 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 WQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWEP ::::::.::::::::::::::::::::::::::: ::::::::::::::::.:: :::: CCDS43 WQRDGEEQTQDTELVETRPAGDGTFQKWAAVVVPPGEEQRYTCHVQHEGLPQPLILRWEQ 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 SSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGSDES : :::::::::::::.::... : :::::.:: :.::: . :: :::: CCDS43 SPQPTIPIVGIVAGLVVLGAV-VTGAVVAAVMWRKKSSDRNRGSYSQAAV 300 310 320 330 340 pF1KE1 LIACKA >>CCDS43439.1 F gene_id:3134|Hs108|chr6 (254 aa) initn: 1268 init1: 1072 opt: 1074 Z-score: 1171.2 bits: 224.8 E(32554): 6.5e-59 Smith-Waterman score: 1074; 66.8% identity (80.0% similar) in 250 aa overlap (4-252:1-248) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF ::::.:.::::::::::.::: :::.::: ::::::::::::.::: :::::::.:: CCDS43 MAPRSLLLLLSGALALTDTWAGSHSLRYFSTAVSRPGRGEPRYIAVEYVDDTQFLRF 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 DSDAASPRGEPRAPWVEQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTLQ ::::: :: ::: ::::::::.::. : : .::::::.:::: :::::::::::: CCDS43 DSDAAIPRMEPREPWVEQEGPQYWEWTTGYAKANAQTDRVALRNLLRRYNQSEAGSHTLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 WMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAEQQ : :::.:::::::::: : ::::::::.:::::::::::::.:::::: .:: . ::. CCDS43 GMNGCDMGPDGRLLRGYHQHAYDGKDYISLNEDLRSWTAADTVAQITQRFYEAEEYAEEF 120 130 140 150 160 170 190 200 210 220 230 pF1KE1 RAYLEGTCVEWLRRYLENGKETLQRAEH-PKTHVTHHLVSDHEATLRCWALGFYPAEITL :.:::: :.: ::::::::::::::::. :. . . ..: . : : . CCDS43 RTYLEGECLELLRRYLENGKETLQRAEQSPQPTIPIVGIVAGLVVLGAVVTGAVVAAVM- 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 TWQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRWE :.. . :... . CCDS43 -WRKKSSDRNRGSYSQAAV 240 250 >>CCDS1342.1 MR1 gene_id:3140|Hs108|chr1 (341 aa) initn: 661 init1: 383 opt: 784 Z-score: 855.3 bits: 166.8 E(32554): 2.6e-41 Smith-Waterman score: 784; 40.9% identity (67.4% similar) in 313 aa overlap (26-335:24-326) 10 20 30 40 50 60 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVRF .::.::: .:: : .: :.::.:::::. .. . CCDS13 MGELMAFLLPLIIVLMVKHSDSRTHSLRYFRLGVSDPIHGVPEFISVGYVDSHPITTY 10 20 30 40 50 70 80 90 100 110 pF1KE1 DSDAASPRGEPRAPWV-EQEGPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHTL :: .. . ::::::. :. .:..:.: :: . : .: :. :. .::.: :::: CCDS13 DS--VTRQKEPRAPWMAENLAPDHWERYTQLLRGWQQMFKVELKRLQRHYNHS--GSHTY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 QWMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARAAE- : : ::.: :: :. : ::::.:.. .:.: :: :.:..:. .. ::: . CCDS13 QRMIGCELLEDGSTT-GFLQYAYDGQDFLIFNKDTLSWLAVDNVAHTIKQAWEANQHELL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 QQRAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEIT :. .:: :. ::.:.:: ::.::::.: : ..:... . ..: : : :::: :: CCDS13 YQKNWLEEECIAWLKRFLEYGKDTLQRTEPPLVRVNRKETFPGVTALFCKAHGFYPPEIY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 LTWQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPLTLRW .::...::. .:. . . :.::::.: ::.. . . :.:::.: :. : . CCDS13 MTWMKNGEEIVQEIDYGDILPSGDGTYQAWASIELDPQSSNLYSCHVEHCGVHMVLQV-- 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 EPSSQPTIPIV-GIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSAQGS :. . :::.: :.: ::.. ::..: ..: :: CCDS13 -PQESETIPLVMKAVSGSIVLVI--VLAGVGVLVWRRRPREQNGAIYLPTPDR 300 310 320 330 340 360 pF1KE1 DESLIACKA >>CCDS4578.1 HFE gene_id:3077|Hs108|chr6 (348 aa) initn: 531 init1: 288 opt: 759 Z-score: 828.1 bits: 161.8 E(32554): 8.4e-40 Smith-Waterman score: 759; 37.6% identity (65.9% similar) in 343 aa overlap (6-343:7-340) 10 20 30 40 50 pF1KE1 MRVMAPRTLILLLSGALALTETWACSHSMRYFYTAVSRPGRGEPRFIAVGYVDDTQFVR : :.:.: . .: :::..:.. ..:. : : :.::::: :: CCDS45 MGPRARPALLLLMLLQTAVLQGRLLRSHSLHYLFMGASEQDLGLSLFEALGYVDDQLFVF 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 FDSDAASPRGEPRAPWVEQE-GPEYWDRETQKYKRQAQTDRVSLRNLRGYYNQSEAGSHT .: . : : :::.::: .. . ..: . .:. : . :.. .. .:.:. ::: CCDS45 YDHE--SRRVEPRTPWVSSRISSQMWLQLSQSLKGWDHMFTVDFWTIMENHNHSKE-SHT 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 LQWMYGCDLGPDGRLLRGYDQSAYDGKDYIALNEDLRSWTAADTAAQITQRKWEAARA-A :: . ::.. :. .:: . .:::.:.. . : .: ::. : :. .:: . : CCDS45 LQVILGCEMQEDNST-EGYWKYGYDGQDHLEFCPDTLDWRAAEPRAWPTKLEWERHKIRA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 EQQRAYLEGTCVEWLRRYLENGKETLQRAEHPKTHVTHHLVSDHEATLRCWALGFYPAEI .:.::::: : :.. :: :. .:.. : ..:::: :.. .:::: ::..:: .: CCDS45 RQNRAYLERDCPAQLQQLLELGRGVLDQQVPPLVKVTHH-VTSSVTTLRCRALNYYPQNI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 TLTWQRDGEDQTQDTELVETR---PAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPL :. : .: : .:.. : . : ::::.: : ...:: ::::::::.:.: :: .:: CCDS45 TMKWLKD--KQPMDAKEFEPKDVLPNGDGTYQGWITLAVPPGEEQRYTCQVEHPGLDQPL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 TLRWEPSSQPTIPIVGIVAGLAVLAVLAVLGAVVAVVMCRRKSSGGKGGSCSQAASSNSA . :::: . :. ..:...:.::..:. .: .. ... .:..: : : CCDS45 IVIWEPSPSGTL-VIGVISGIAVFVVILFIG-ILFIILRKRQGSRGAMGHYVLAERE 300 310 320 330 340 360 pF1KE1 QGSDESLIACKA 366 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 02:44:02 2016 done: Mon Nov 7 02:44:02 2016 Total Scan time: 1.480 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]