FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4038, 253 aa 1>>>pF1KE4038 253 - 253 aa - 253 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4339+/-0.00074; mu= 13.9867+/- 0.045 mean_var=69.9950+/-14.284, 0's: 0 Z-trim(109.0): 37 B-trim: 406 in 2/51 Lambda= 0.153300 statistics sampled from 10567 (10599) to 10567 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.326), width: 16 Scan time: 2.340 The best scores are: opt bits E(32554) CCDS4141.1 MARCH3 gene_id:115123|Hs108|chr5 ( 253) 1746 394.8 2.9e-110 CCDS12202.1 MARCH2 gene_id:51257|Hs108|chr19 ( 246) 1080 247.5 6.2e-66 CCDS32894.1 MARCH2 gene_id:51257|Hs108|chr19 ( 176) 548 129.8 1.2e-30 CCDS3806.1 MARCH1 gene_id:55016|Hs108|chr4 ( 272) 296 74.2 1.1e-13 CCDS54814.1 MARCH1 gene_id:55016|Hs108|chr4 ( 289) 296 74.2 1.1e-13 CCDS7213.1 MARCH8 gene_id:220972|Hs108|chr10 ( 291) 293 73.5 1.8e-13 CCDS60519.1 MARCH8 gene_id:220972|Hs108|chr10 ( 573) 287 72.3 7.9e-13 >>CCDS4141.1 MARCH3 gene_id:115123|Hs108|chr5 (253 aa) initn: 1746 init1: 1746 opt: 1746 Z-score: 2093.0 bits: 394.8 E(32554): 2.9e-110 Smith-Waterman score: 1746; 100.0% identity (100.0% similar) in 253 aa overlap (1-253:1-253) 10 20 30 40 50 60 pF1KE4 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EAVGLIALTVALFTIYLFWTLVSFRYHCRLYNEWRRTNQRVILLIPKSVNVPSNQPSLLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EAVGLIALTVALFTIYLFWTLVSFRYHCRLYNEWRRTNQRVILLIPKSVNVPSNQPSLLG 190 200 210 220 230 240 250 pF1KE4 LHSVKRNSKETVV ::::::::::::: CCDS41 LHSVKRNSKETVV 250 >>CCDS12202.1 MARCH2 gene_id:51257|Hs108|chr19 (246 aa) initn: 1085 init1: 893 opt: 1080 Z-score: 1297.2 bits: 247.5 E(32554): 6.2e-66 Smith-Waterman score: 1080; 64.7% identity (82.0% similar) in 255 aa overlap (1-253:1-246) 10 20 30 40 50 60 pF1KE4 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA :::. : ::: : ::..: : :.:: : : :::: ::...::.:::::.:.: CCDS12 MTTGDCCHLPGSLCDCSGSPA-FSKVVEATGL---GPPQYVAQVTSRDGRLLSTVIRALD 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF : : : :.:::::::.. : ::::: ::::::..:.::::.:::::::::::::: .: CCDS12 TPS---DGPFCRICHEGANGECLLSPCGCTGTLGAVHKSCLEKWLSSSNTSYCELCHTEF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL :::..::::.:::..:::. ::::: ::::::::::::.:::::::::: :::.. :.: CCDS12 AVEKRPRPLTEWLKDPGPRTEKRTLCCDMVCFLFITPLAAISGWLCLRGAQDHLRLHSQL 120 130 140 150 160 170 190 200 210 220 230 pF1KE4 EAVGLIALTVALFTIYLFWTLVSFRYHCRLYNEWRRTNQRVILLIPK--SVNVPSNQPSL :::::::::.::::::..::::::::::.::.:::.:::.: : : . : . :...: CCDS12 EAVGLIALTIALFTIYVLWTLVSFRYHCQLYSEWRKTNQKVRLKIREADSPEGPQHSPLA 180 190 200 210 220 230 240 250 pF1KE4 LGLHSVKRNSKETVV :: .:. ..:: : CCDS12 AGL--LKKVAEETPV 240 >>CCDS32894.1 MARCH2 gene_id:51257|Hs108|chr19 (176 aa) initn: 688 init1: 362 opt: 548 Z-score: 663.5 bits: 129.8 E(32554): 1.2e-30 Smith-Waterman score: 548; 63.4% identity (79.4% similar) in 131 aa overlap (1-131:1-124) 10 20 30 40 50 60 pF1KE4 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA :::. : ::: : ::..: : :.:: : : :::: ::...::.:::::.:.: CCDS32 MTTGDCCHLPGSLCDCSGSPA-FSKVVEATGL---GPPQYVAQVTSRDGRLLSTVIRALD 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF : : : :.:::::::.. : ::::: ::::::..:.::::.:::::::::::::: .: CCDS32 TPS---DGPFCRICHEGANGECLLSPCGCTGTLGAVHKSCLEKWLSSSNTSYCELCHTEF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL :::..::::.: CCDS32 AVEKRPRPLTEVSFRYHCQLYSEWRKTNQKVRLKIREADSPEGPQHSPLAAGLLKKVAEE 120 130 140 150 160 170 >>CCDS3806.1 MARCH1 gene_id:55016|Hs108|chr4 (272 aa) initn: 269 init1: 230 opt: 296 Z-score: 359.4 bits: 74.2 E(32554): 1.1e-13 Smith-Waterman score: 296; 30.2% identity (63.0% similar) in 192 aa overlap (70-253:62-248) 40 50 60 70 80 90 pF1KE4 YVMQVSAKDGQLLSTVVRTLATQSPFNDRPMCRICH-EGSSQEDLLSPCECTGTLGTIHR .::::: ::. . :..::.::::: .:. CCDS38 SNLFLQASSPTTGTAPRSQSRLSVCPSTQDICRICHCEGDEESPLITPCRCTGTLRFVHQ 40 50 60 70 80 90 100 110 120 130 140 150 pF1KE4 SCLEHWLSSSNTSYCELCHFRFAVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPL :::..:..::.: ::::.. : .: : .:: .: . :.: .: ... .. CCDS38 SCLHQWIKSSDTRCCELCKYDFIMETKLKPLRKWEKLQMTTSERRKIFCSVTFHVIAITC 100 110 120 130 140 150 160 170 180 190 200 210 pF1KE4 ATISGWLCLRGAVDHLHFSSRLEAVGLIALTVALFTIYLFWT--LVSFRYHCRLYNE-WR .. : .. . ...... .. ..: . . : .. . .: :: . .:..: . :: CCDS38 VVWSLYVLIDRTAEEIK-QGNDNGVLEWPFWTKLVVVAIGFTGGLVFMYVQCKVYVQLWR 160 170 180 190 200 210 220 230 240 250 pF1KE4 RTN--QRVILLIPKSVNVPSNQPSLLGLHSVKRNS--KETVV : . .:::.. : :.. .: : . :. :..:: CCDS38 RLKAYNRVIFVQ----NCPDTAKKLEKNFSCNVNTDIKDAVVVPVPQTGANSLPSAEGGP 220 230 240 250 260 CCDS38 PEVVSV 270 >>CCDS54814.1 MARCH1 gene_id:55016|Hs108|chr4 (289 aa) initn: 269 init1: 230 opt: 296 Z-score: 359.0 bits: 74.2 E(32554): 1.1e-13 Smith-Waterman score: 296; 30.2% identity (63.0% similar) in 192 aa overlap (70-253:79-265) 40 50 60 70 80 90 pF1KE4 YVMQVSAKDGQLLSTVVRTLATQSPFNDRPMCRICH-EGSSQEDLLSPCECTGTLGTIHR .::::: ::. . :..::.::::: .:. CCDS54 SSNISKASSPTTGTAPRSQSRLSVCPSTQDICRICHCEGDEESPLITPCRCTGTLRFVHQ 50 60 70 80 90 100 100 110 120 130 140 150 pF1KE4 SCLEHWLSSSNTSYCELCHFRFAVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPL :::..:..::.: ::::.. : .: : .:: .: . :.: .: ... .. CCDS54 SCLHQWIKSSDTRCCELCKYDFIMETKLKPLRKWEKLQMTTSERRKIFCSVTFHVIAITC 110 120 130 140 150 160 160 170 180 190 200 210 pF1KE4 ATISGWLCLRGAVDHLHFSSRLEAVGLIALTVALFTIYLFWT--LVSFRYHCRLYNE-WR .. : .. . ...... .. ..: . . : .. . .: :: . .:..: . :: CCDS54 VVWSLYVLIDRTAEEIK-QGNDNGVLEWPFWTKLVVVAIGFTGGLVFMYVQCKVYVQLWR 170 180 190 200 210 220 220 230 240 250 pF1KE4 RTN--QRVILLIPKSVNVPSNQPSLLGLHSVKRNS--KETVV : . .:::.. : :.. .: : . :. :..:: CCDS54 RLKAYNRVIFVQ----NCPDTAKKLEKNFSCNVNTDIKDAVVVPVPQTGANSLPSAEGGP 230 240 250 260 270 280 CCDS54 PEVVSV >>CCDS7213.1 MARCH8 gene_id:220972|Hs108|chr10 (291 aa) initn: 266 init1: 229 opt: 293 Z-score: 355.4 bits: 73.5 E(32554): 1.8e-13 Smith-Waterman score: 293; 31.0% identity (62.0% similar) in 187 aa overlap (45-222:57-236) 20 30 40 50 60 70 pF1KE4 DCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLATQSPFNDRPMCRIC ::. .:. :: : : .. .:::: CCDS72 KEKEREEQNEKTLGHFMSHSSNISKAGSPPSASAPAPVSSFSRTSITPS---SQDICRIC 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE4 H-EGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRFAVERKPRPLVEWL : ::... :..::.:::.: .:..::..:..::.: ::::...: .: : .:: .: CCDS72 HCEGDDESPLITPCHCTGSLHFVHQACLQQWIKSSDTRCCELCKYEFIMETKLKPLRKWE 90 100 110 120 130 140 140 150 160 170 180 190 pF1KE4 RNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL-EAVGLIA--LTV . . :.: .. . : : :. .. : : .:. . .:.:.. . . CCDS72 KLQMTSSERRKIMCS-VTFHVIAITCVV--W-SLYVLIDRTAEEIKQGQATGILEWPFWT 150 160 170 180 190 200 210 220 230 240 pF1KE4 ALFTIYLFWT--LVSFRYHCRLYNE-WRRTN--QRVILLIPKSVNVPSNQPSLLGLHSVK : .. . .: :. . .:..: . :.: . .::: CCDS72 KLVVVAIGFTGGLLFMYVQCKVYVQLWKRLKAYNRVIYVQNCPETSKKNIFEKSPLTEPN 200 210 220 230 240 250 250 pF1KE4 RNSKETVV CCDS72 FENKHGYGICHSDTNSSCCTEPEDTGAEIIHV 260 270 280 290 >>CCDS60519.1 MARCH8 gene_id:220972|Hs108|chr10 (573 aa) initn: 264 init1: 229 opt: 287 Z-score: 343.8 bits: 72.3 E(32554): 7.9e-13 Smith-Waterman score: 287; 30.5% identity (61.1% similar) in 190 aa overlap (45-222:333-518) 20 30 40 50 60 70 pF1KE4 DCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLL--STVVRTLATQSPFNDR-PMC . ::..: : . : :: . .: CCDS60 CSDEMGDDDVFEDSTSAKLKSRVLRAPLCSTEKDSDLDCPSPFSEKLPPISPVSTSGDVC 310 320 330 340 350 360 80 90 100 110 120 130 pF1KE4 RICH-EGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRFAVERKPRPLV :::: ::... :..::.:::.: .:..::..:..::.: ::::...: .: : .:: CCDS60 RICHCEGDDESPLITPCHCTGSLHFVHQACLQQWIKSSDTRCCELCKYEFIMETKLKPLR 370 380 390 400 410 420 140 150 160 170 180 pF1KE4 EWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL-EAVGLIA-- .: . . :.: .. . : : :. .. : : .:. . .:.:.. CCDS60 KWEKLQMTSSERRKIMCS-VTFHVIAITCVV--W-SLYVLIDRTAEEIKQGQATGILEWP 430 440 450 460 470 190 200 210 220 230 240 pF1KE4 LTVALFTIYLFWT--LVSFRYHCRLYNE-WRRTN--QRVILLIPKSVNVPSNQPSLLGLH . . : .. . .: :. . .:..: . :.: . .::: CCDS60 FWTKLVVVAIGFTGGLLFMYVQCKVYVQLWKRLKAYNRVIYVQNCPETSKKNIFEKSPLT 480 490 500 510 520 530 250 pF1KE4 SVKRNSKETVV CCDS60 EPNFENKHGYGICHSDTNSSCCTEPEDTGAEIIHV 540 550 560 570 253 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 03:40:22 2016 done: Sun Nov 6 03:40:22 2016 Total Scan time: 2.340 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]