FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4038, 253 aa
1>>>pF1KE4038 253 - 253 aa - 253 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4339+/-0.00074; mu= 13.9867+/- 0.045
mean_var=69.9950+/-14.284, 0's: 0 Z-trim(109.0): 37 B-trim: 406 in 2/51
Lambda= 0.153300
statistics sampled from 10567 (10599) to 10567 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.326), width: 16
Scan time: 2.340
The best scores are: opt bits E(32554)
CCDS4141.1 MARCH3 gene_id:115123|Hs108|chr5 ( 253) 1746 394.8 2.9e-110
CCDS12202.1 MARCH2 gene_id:51257|Hs108|chr19 ( 246) 1080 247.5 6.2e-66
CCDS32894.1 MARCH2 gene_id:51257|Hs108|chr19 ( 176) 548 129.8 1.2e-30
CCDS3806.1 MARCH1 gene_id:55016|Hs108|chr4 ( 272) 296 74.2 1.1e-13
CCDS54814.1 MARCH1 gene_id:55016|Hs108|chr4 ( 289) 296 74.2 1.1e-13
CCDS7213.1 MARCH8 gene_id:220972|Hs108|chr10 ( 291) 293 73.5 1.8e-13
CCDS60519.1 MARCH8 gene_id:220972|Hs108|chr10 ( 573) 287 72.3 7.9e-13
>>CCDS4141.1 MARCH3 gene_id:115123|Hs108|chr5 (253 aa)
initn: 1746 init1: 1746 opt: 1746 Z-score: 2093.0 bits: 394.8 E(32554): 2.9e-110
Smith-Waterman score: 1746; 100.0% identity (100.0% similar) in 253 aa overlap (1-253:1-253)
10 20 30 40 50 60
pF1KE4 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 EAVGLIALTVALFTIYLFWTLVSFRYHCRLYNEWRRTNQRVILLIPKSVNVPSNQPSLLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EAVGLIALTVALFTIYLFWTLVSFRYHCRLYNEWRRTNQRVILLIPKSVNVPSNQPSLLG
190 200 210 220 230 240
250
pF1KE4 LHSVKRNSKETVV
:::::::::::::
CCDS41 LHSVKRNSKETVV
250
>>CCDS12202.1 MARCH2 gene_id:51257|Hs108|chr19 (246 aa)
initn: 1085 init1: 893 opt: 1080 Z-score: 1297.2 bits: 247.5 E(32554): 6.2e-66
Smith-Waterman score: 1080; 64.7% identity (82.0% similar) in 255 aa overlap (1-253:1-246)
10 20 30 40 50 60
pF1KE4 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA
:::. : ::: : ::..: : :.:: : : :::: ::...::.:::::.:.:
CCDS12 MTTGDCCHLPGSLCDCSGSPA-FSKVVEATGL---GPPQYVAQVTSRDGRLLSTVIRALD
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF
: : : :.:::::::.. : ::::: ::::::..:.::::.:::::::::::::: .:
CCDS12 TPS---DGPFCRICHEGANGECLLSPCGCTGTLGAVHKSCLEKWLSSSNTSYCELCHTEF
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL
:::..::::.:::..:::. ::::: ::::::::::::.:::::::::: :::.. :.:
CCDS12 AVEKRPRPLTEWLKDPGPRTEKRTLCCDMVCFLFITPLAAISGWLCLRGAQDHLRLHSQL
120 130 140 150 160 170
190 200 210 220 230
pF1KE4 EAVGLIALTVALFTIYLFWTLVSFRYHCRLYNEWRRTNQRVILLIPK--SVNVPSNQPSL
:::::::::.::::::..::::::::::.::.:::.:::.: : : . : . :...:
CCDS12 EAVGLIALTIALFTIYVLWTLVSFRYHCQLYSEWRKTNQKVRLKIREADSPEGPQHSPLA
180 190 200 210 220 230
240 250
pF1KE4 LGLHSVKRNSKETVV
:: .:. ..:: :
CCDS12 AGL--LKKVAEETPV
240
>>CCDS32894.1 MARCH2 gene_id:51257|Hs108|chr19 (176 aa)
initn: 688 init1: 362 opt: 548 Z-score: 663.5 bits: 129.8 E(32554): 1.2e-30
Smith-Waterman score: 548; 63.4% identity (79.4% similar) in 131 aa overlap (1-131:1-124)
10 20 30 40 50 60
pF1KE4 MTTSRCSHLPEVLPDCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLA
:::. : ::: : ::..: : :.:: : : :::: ::...::.:::::.:.:
CCDS32 MTTGDCCHLPGSLCDCSGSPA-FSKVVEATGL---GPPQYVAQVTSRDGRLLSTVIRALD
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 TQSPFNDRPMCRICHEGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRF
: : : :.:::::::.. : ::::: ::::::..:.::::.:::::::::::::: .:
CCDS32 TPS---DGPFCRICHEGANGECLLSPCGCTGTLGAVHKSCLEKWLSSSNTSYCELCHTEF
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 AVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL
:::..::::.:
CCDS32 AVEKRPRPLTEVSFRYHCQLYSEWRKTNQKVRLKIREADSPEGPQHSPLAAGLLKKVAEE
120 130 140 150 160 170
>>CCDS3806.1 MARCH1 gene_id:55016|Hs108|chr4 (272 aa)
initn: 269 init1: 230 opt: 296 Z-score: 359.4 bits: 74.2 E(32554): 1.1e-13
Smith-Waterman score: 296; 30.2% identity (63.0% similar) in 192 aa overlap (70-253:62-248)
40 50 60 70 80 90
pF1KE4 YVMQVSAKDGQLLSTVVRTLATQSPFNDRPMCRICH-EGSSQEDLLSPCECTGTLGTIHR
.::::: ::. . :..::.::::: .:.
CCDS38 SNLFLQASSPTTGTAPRSQSRLSVCPSTQDICRICHCEGDEESPLITPCRCTGTLRFVHQ
40 50 60 70 80 90
100 110 120 130 140 150
pF1KE4 SCLEHWLSSSNTSYCELCHFRFAVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPL
:::..:..::.: ::::.. : .: : .:: .: . :.: .: ... ..
CCDS38 SCLHQWIKSSDTRCCELCKYDFIMETKLKPLRKWEKLQMTTSERRKIFCSVTFHVIAITC
100 110 120 130 140 150
160 170 180 190 200 210
pF1KE4 ATISGWLCLRGAVDHLHFSSRLEAVGLIALTVALFTIYLFWT--LVSFRYHCRLYNE-WR
.. : .. . ...... .. ..: . . : .. . .: :: . .:..: . ::
CCDS38 VVWSLYVLIDRTAEEIK-QGNDNGVLEWPFWTKLVVVAIGFTGGLVFMYVQCKVYVQLWR
160 170 180 190 200 210
220 230 240 250
pF1KE4 RTN--QRVILLIPKSVNVPSNQPSLLGLHSVKRNS--KETVV
: . .:::.. : :.. .: : . :. :..::
CCDS38 RLKAYNRVIFVQ----NCPDTAKKLEKNFSCNVNTDIKDAVVVPVPQTGANSLPSAEGGP
220 230 240 250 260
CCDS38 PEVVSV
270
>>CCDS54814.1 MARCH1 gene_id:55016|Hs108|chr4 (289 aa)
initn: 269 init1: 230 opt: 296 Z-score: 359.0 bits: 74.2 E(32554): 1.1e-13
Smith-Waterman score: 296; 30.2% identity (63.0% similar) in 192 aa overlap (70-253:79-265)
40 50 60 70 80 90
pF1KE4 YVMQVSAKDGQLLSTVVRTLATQSPFNDRPMCRICH-EGSSQEDLLSPCECTGTLGTIHR
.::::: ::. . :..::.::::: .:.
CCDS54 SSNISKASSPTTGTAPRSQSRLSVCPSTQDICRICHCEGDEESPLITPCRCTGTLRFVHQ
50 60 70 80 90 100
100 110 120 130 140 150
pF1KE4 SCLEHWLSSSNTSYCELCHFRFAVERKPRPLVEWLRNPGPQHEKRTLFGDMVCFLFITPL
:::..:..::.: ::::.. : .: : .:: .: . :.: .: ... ..
CCDS54 SCLHQWIKSSDTRCCELCKYDFIMETKLKPLRKWEKLQMTTSERRKIFCSVTFHVIAITC
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE4 ATISGWLCLRGAVDHLHFSSRLEAVGLIALTVALFTIYLFWT--LVSFRYHCRLYNE-WR
.. : .. . ...... .. ..: . . : .. . .: :: . .:..: . ::
CCDS54 VVWSLYVLIDRTAEEIK-QGNDNGVLEWPFWTKLVVVAIGFTGGLVFMYVQCKVYVQLWR
170 180 190 200 210 220
220 230 240 250
pF1KE4 RTN--QRVILLIPKSVNVPSNQPSLLGLHSVKRNS--KETVV
: . .:::.. : :.. .: : . :. :..::
CCDS54 RLKAYNRVIFVQ----NCPDTAKKLEKNFSCNVNTDIKDAVVVPVPQTGANSLPSAEGGP
230 240 250 260 270 280
CCDS54 PEVVSV
>>CCDS7213.1 MARCH8 gene_id:220972|Hs108|chr10 (291 aa)
initn: 266 init1: 229 opt: 293 Z-score: 355.4 bits: 73.5 E(32554): 1.8e-13
Smith-Waterman score: 293; 31.0% identity (62.0% similar) in 187 aa overlap (45-222:57-236)
20 30 40 50 60 70
pF1KE4 DCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLLSTVVRTLATQSPFNDRPMCRIC
::. .:. :: : : .. .::::
CCDS72 KEKEREEQNEKTLGHFMSHSSNISKAGSPPSASAPAPVSSFSRTSITPS---SQDICRIC
30 40 50 60 70 80
80 90 100 110 120 130
pF1KE4 H-EGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRFAVERKPRPLVEWL
: ::... :..::.:::.: .:..::..:..::.: ::::...: .: : .:: .:
CCDS72 HCEGDDESPLITPCHCTGSLHFVHQACLQQWIKSSDTRCCELCKYEFIMETKLKPLRKWE
90 100 110 120 130 140
140 150 160 170 180 190
pF1KE4 RNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL-EAVGLIA--LTV
. . :.: .. . : : :. .. : : .:. . .:.:.. . .
CCDS72 KLQMTSSERRKIMCS-VTFHVIAITCVV--W-SLYVLIDRTAEEIKQGQATGILEWPFWT
150 160 170 180 190
200 210 220 230 240
pF1KE4 ALFTIYLFWT--LVSFRYHCRLYNE-WRRTN--QRVILLIPKSVNVPSNQPSLLGLHSVK
: .. . .: :. . .:..: . :.: . .:::
CCDS72 KLVVVAIGFTGGLLFMYVQCKVYVQLWKRLKAYNRVIYVQNCPETSKKNIFEKSPLTEPN
200 210 220 230 240 250
250
pF1KE4 RNSKETVV
CCDS72 FENKHGYGICHSDTNSSCCTEPEDTGAEIIHV
260 270 280 290
>>CCDS60519.1 MARCH8 gene_id:220972|Hs108|chr10 (573 aa)
initn: 264 init1: 229 opt: 287 Z-score: 343.8 bits: 72.3 E(32554): 7.9e-13
Smith-Waterman score: 287; 30.5% identity (61.1% similar) in 190 aa overlap (45-222:333-518)
20 30 40 50 60 70
pF1KE4 DCTSSAAPVVKTVEDCGSLVNGQPQYVMQVSAKDGQLL--STVVRTLATQSPFNDR-PMC
. ::..: : . : :: . .:
CCDS60 CSDEMGDDDVFEDSTSAKLKSRVLRAPLCSTEKDSDLDCPSPFSEKLPPISPVSTSGDVC
310 320 330 340 350 360
80 90 100 110 120 130
pF1KE4 RICH-EGSSQEDLLSPCECTGTLGTIHRSCLEHWLSSSNTSYCELCHFRFAVERKPRPLV
:::: ::... :..::.:::.: .:..::..:..::.: ::::...: .: : .::
CCDS60 RICHCEGDDESPLITPCHCTGSLHFVHQACLQQWIKSSDTRCCELCKYEFIMETKLKPLR
370 380 390 400 410 420
140 150 160 170 180
pF1KE4 EWLRNPGPQHEKRTLFGDMVCFLFITPLATISGWLCLRGAVDHLHFSSRL-EAVGLIA--
.: . . :.: .. . : : :. .. : : .:. . .:.:..
CCDS60 KWEKLQMTSSERRKIMCS-VTFHVIAITCVV--W-SLYVLIDRTAEEIKQGQATGILEWP
430 440 450 460 470
190 200 210 220 230 240
pF1KE4 LTVALFTIYLFWT--LVSFRYHCRLYNE-WRRTN--QRVILLIPKSVNVPSNQPSLLGLH
. . : .. . .: :. . .:..: . :.: . .:::
CCDS60 FWTKLVVVAIGFTGGLLFMYVQCKVYVQLWKRLKAYNRVIYVQNCPETSKKNIFEKSPLT
480 490 500 510 520 530
250
pF1KE4 SVKRNSKETVV
CCDS60 EPNFENKHGYGICHSDTNSSCCTEPEDTGAEIIHV
540 550 560 570
253 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 03:40:22 2016 done: Sun Nov 6 03:40:22 2016
Total Scan time: 2.340 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]