FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1801, 313 aa
1>>>pF1KE1801 313 - 313 aa - 313 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1110+/-0.00068; mu= 12.8386+/- 0.042
mean_var=81.7359+/-16.097, 0's: 0 Z-trim(111.8): 11 B-trim: 215 in 1/51
Lambda= 0.141863
statistics sampled from 12677 (12687) to 12677 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.751), E-opt: 0.2 (0.39), width: 16
Scan time: 2.890
The best scores are: opt bits E(32554)
CCDS7858.1 GAS2 gene_id:2620|Hs108|chr11 ( 313) 2118 442.4 2.1e-124
CCDS9079.1 GAS2L3 gene_id:283431|Hs108|chr12 ( 694) 1160 246.5 4.4e-65
CCDS76590.1 GAS2L3 gene_id:283431|Hs108|chr12 ( 590) 861 185.3 1e-46
CCDS11298.1 GAS2L2 gene_id:246176|Hs108|chr17 ( 880) 697 151.8 1.8e-36
CCDS63438.1 GAS2L1 gene_id:10634|Hs108|chr22 ( 454) 384 87.6 1.9e-17
CCDS74840.1 GAS2L1 gene_id:10634|Hs108|chr22 ( 681) 384 87.7 2.8e-17
>>CCDS7858.1 GAS2 gene_id:2620|Hs108|chr11 (313 aa)
initn: 2118 init1: 2118 opt: 2118 Z-score: 2347.0 bits: 442.4 E(32554): 2.1e-124
Smith-Waterman score: 2118; 100.0% identity (100.0% similar) in 313 aa overlap (1-313:1-313)
10 20 30 40 50 60
pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNLLGKEITAETFMEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNLLGKEITAETFMEK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 LDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLSWC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 LDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLSWC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 RDLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEETLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 RDLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEETLS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 APSPSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVGEKILFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 APSPSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVGEKILFI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 RMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQSKSPTLKDMNPDNYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 RMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQSKSPTLKDMNPDNYL
250 260 270 280 290 300
310
pF1KE1 VVSASYKAKKEIK
:::::::::::::
CCDS78 VVSASYKAKKEIK
310
>>CCDS9079.1 GAS2L3 gene_id:283431|Hs108|chr12 (694 aa)
initn: 1154 init1: 497 opt: 1160 Z-score: 1282.0 bits: 246.5 E(32554): 4.4e-65
Smith-Waterman score: 1162; 56.7% identity (78.5% similar) in 307 aa overlap (3-296:19-319)
10 20 30 40
pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWL
. :.: : ::::... ::..:.: ::::.::::.:::..::
CCDS90 MQPAIQVWFGEDLPLSPRSPLTP--RHGPGLANVCQYDEWIAVRHEATLLPMQEDLSIWL
10 20 30 40 50
50 60 70 80 90 100
pF1KE1 TNLLGKEITAETFMEKLDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPS
..::: .. :: ..:.::::.::::: ...:. : .. . :.:..:.::: .: :
CCDS90 SGLLGIKVKAEKLLEELDNGVLLCQLIDVLQNMVKTC--NSEESGNFPMRKVPCKKDAAS
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE1 GSFFARDNTANFLSWCRDLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPP
::::::::::::: ::::.::::: :::::::::::.::.: :::::.:::..:::::::
CCDS90 GSFFARDNTANFLHWCRDIGVDETYLFESEGLVLHKDPRQVYLCLLEIGRIVSRYGVEPP
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 GLIKLEKEIEQEETLSAPS-PSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCV
:.::::::: :::: : : : : .: . . : .:::.:.:::::.: ..: .
CCDS90 VLVKLEKEIELEETLLNTSGPEDSISIPKSCCRH--EELHEAVKHIAEDPPCSCSHRFSI
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 ERLSQGRYRVGEKILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSP
: ::.::::.:.:::::::::.:::::::::::.:. :.:::.::::.::.. .. :
CCDS90 EYLSEGRYRLGDKILFIRMLHGKHVMVRVGGGWDTLQGFLLKYDPCRILQFATLEQKILA
240 250 260 270 280 290
290 300 310
pF1KE1 IQ------------SKSPTLKDMNPDNYLVVSASYKAKKEIK
.: ...: .:::
CCDS90 FQKGVSNESVPDSPARTPQPPEMNPLSAVNMFQKQNSKPSVPVSIPKSKEKQGRPPGALV
300 310 320 330 340 350
>>CCDS76590.1 GAS2L3 gene_id:283431|Hs108|chr12 (590 aa)
initn: 878 init1: 478 opt: 861 Z-score: 952.4 bits: 185.3 E(32554): 1e-46
Smith-Waterman score: 863; 60.4% identity (78.3% similar) in 217 aa overlap (93-296:1-215)
70 80 90 100 110 120
pF1KE1 NGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLSWCRD
..:.::: .: :::::::::::::: ::::
CCDS76 MRKVPCKKDAASGSFFARDNTANFLHWCRD
10 20 30
130 140 150 160 170 180
pF1KE1 LGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEETLSAP
.::::: :::::::::::.::.: :::::.:::..::::::: :.::::::: ::::
CCDS76 IGVDETYLFESEGLVLHKDPRQVYLCLLEIGRIVSRYGVEPPVLVKLEKEIELEETLLNT
40 50 60 70 80 90
190 200 210 220 230 240
pF1KE1 S-PSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVGEKILFIR
: : : : .: . . : .:::.:.:::::.: ..: .: ::.::::.:.::::::
CCDS76 SGPEDSISIPKSCCRH--EELHEAVKHIAEDPPCSCSHRFSIEYLSEGRYRLGDKILFIR
100 110 120 130 140
250 260 270 280
pF1KE1 MLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQ------------SKSP
:::.:::::::::::.:. :.:::.::::.::.. .. : .: ...:
CCDS76 MLHGKHVMVRVGGGWDTLQGFLLKYDPCRILQFATLEQKILAFQKGVSNESVPDSPARTP
150 160 170 180 190 200
290 300 310
pF1KE1 TLKDMNPDNYLVVSASYKAKKEIK
.:::
CCDS76 QPPEMNPLSAVNMFQKQNSKPSVPVSIPKSKEKQGRPPGALVPASSLKGGNLGSMSVRSK
210 220 230 240 250 260
>>CCDS11298.1 GAS2L2 gene_id:246176|Hs108|chr17 (880 aa)
initn: 547 init1: 293 opt: 697 Z-score: 768.3 bits: 151.8 E(32554): 1.8e-36
Smith-Waterman score: 697; 41.7% identity (69.4% similar) in 271 aa overlap (30-292:28-293)
10 20 30 40 50 60
pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNLLGKEITAETFMEK
: : :::::: :: .: : .: : .:..
CCDS11 MSQPAGGRRKPRTLGPPVCSIRPFKSSEQYLEAMKEDLAEWLRDLYGLDIDAANFLQV
10 20 30 40 50
70 80 90 100 110
pF1KE1 LDNGALLCQLAETMQEKFKESM-DANKPTKNLPLKKI--PCKTSAPSGSFFARDNTANFL
:..: .::: :... . . .: ....:. .. :. .: :.: ::::..::.
CCDS11 LETGLVLCQHANVVTDAALAFLAEAPAQAQKIPMPRVGVSCNGAAQPGTFQARDNVSNFI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 SWCR-DLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQE
.::: ..:..:. .::.: :::.:. ..: :::::::: : :.:: : :..::.:::.:
CCDS11 QWCRKEMGIQEVLMFETEDLVLRKNVKNVVLCLLELGRRAWRFGVAAPTLVQLEEEIEEE
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 --ETLSAPSPSPSPSSKSSGKKSTGNLLDDAVKRISEDPPCKCPNKFCVERLSQGRYRVG
. :. : :.::: . . ::. :. . : :: .: . ..:.:.::::
CCDS11 VRRELALPPPDPSPPAPPRRQPCHFRNLDQMVQSLVSH--CTCPVQFSMVKVSEGKYRVG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE1 EK--ILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGKTSPIQSKSPTLK
.. ..:::.:.: ::::::::::.:.. :: :::::: ..:. : : .. .: ..
CCDS11 DSNTLIFIRILRN-HVMVRVGGGWDTLGHYLDKHDPCRCTSLSHKPG--SFLKPPAPPVQ
240 250 260 270 280 290
300 310
pF1KE1 DMNPDNYLVVSASYKAKKEIK
CCDS11 HEVRVQDGPSQTQPTMTISRSQSPPPPVDWKTYTSSDRRLRPPTPSSPRPRRERGAGTGA
300 310 320 330 340 350
>>CCDS63438.1 GAS2L1 gene_id:10634|Hs108|chr22 (454 aa)
initn: 536 init1: 176 opt: 384 Z-score: 426.5 bits: 87.6 E(32554): 1.9e-17
Smith-Waterman score: 605; 41.0% identity (69.3% similar) in 261 aa overlap (30-270:23-275)
10 20 30 40 50
pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNL--LGKEITAETFM
:: . :::::: ::. : :: .. :.
CCDS63 MADPVAGIAGSAAKSVRPFRSSEAYVEAMKEDLAEWLNALYGLGLPGGGDGFL
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 EKLDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLS
: .:. ::: :... : . .. : .:.... .. .. .: :::.::::.:.:..
CCDS63 TGLATGTTLCQHANAVTEAAR-ALAAARPARGVAFQA---HSVVP-GSFMARDNVATFIG
60 70 80 90 100
120 130 140 150 160 170
pF1KE1 WCR-DLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEE
::: .::: :. .::.: :::.:. . : :::::..: .:: :. : :...:.:::.:
CCDS63 WCRVELGVPEVLMFETEDLVLRKNEKSVVLCLLEVARRGARLGLLAPRLVQFEQEIEREL
110 120 130 140 150 160
180 190 200 210 220
pF1KE1 TLSAPSPS------------PSPSSKSSGKKST-GNL--LDDAVKRISEDPPCKCPNKFC
. :.:. :.:.. . : . : ..: ::. :..: : ::..:
CCDS63 RAAPPAPNAPAAGEDTTETAPAPGTPARGPRMTPSDLRNLDELVREILGR--CTCPDQFP
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE1 VERLSQGRYRVGEK--ILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGK
. ..:.:.::::.. ..:.:.:.. ::::::::::.:. :: ::::::
CCDS63 MIKVSEGKYRVGDSSLLIFVRVLRS-HVMVRVGGGWDTLEHYLDKHDPCRCSSTAHRPPQ
230 240 250 260 270 280
290 300 310
pF1KE1 TSPIQSKSPTLKDMNPDNYLVVSASYKAKKEIK
CCDS63 PRVCTFSPQRVSPTTSPRPASPVPGSERRGSRPEMTPVSLRSTKEGPETPPSSSSSSLSV
290 300 310 320 330 340
>>CCDS74840.1 GAS2L1 gene_id:10634|Hs108|chr22 (681 aa)
initn: 536 init1: 176 opt: 384 Z-score: 423.8 bits: 87.7 E(32554): 2.8e-17
Smith-Waterman score: 605; 41.0% identity (69.3% similar) in 261 aa overlap (30-270:23-275)
10 20 30 40 50
pF1KE1 MCTALSPKVRSGPGLSDMHQYSQWLASRHEANLLPMKEDLALWLTNL--LGKEITAETFM
:: . :::::: ::. : :: .. :.
CCDS74 MADPVAGIAGSAAKSVRPFRSSEAYVEAMKEDLAEWLNALYGLGLPGGGDGFL
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 EKLDNGALLCQLAETMQEKFKESMDANKPTKNLPLKKIPCKTSAPSGSFFARDNTANFLS
: .:. ::: :... : . .. : .:.... .. .. .: :::.::::.:.:..
CCDS74 TGLATGTTLCQHANAVTEAAR-ALAAARPARGVAFQA---HSVVP-GSFMARDNVATFIG
60 70 80 90 100
120 130 140 150 160 170
pF1KE1 WCR-DLGVDETCLFESEGLVLHKQPREVCLCLLELGRIAARYGVEPPGLIKLEKEIEQEE
::: .::: :. .::.: :::.:. . : :::::..: .:: :. : :...:.:::.:
CCDS74 WCRVELGVPEVLMFETEDLVLRKNEKSVVLCLLEVARRGARLGLLAPRLVQFEQEIEREL
110 120 130 140 150 160
180 190 200 210 220
pF1KE1 TLSAPSPS------------PSPSSKSSGKKST-GNL--LDDAVKRISEDPPCKCPNKFC
. :.:. :.:.. . : . : ..: ::. :..: : ::..:
CCDS74 RAAPPAPNAPAAGEDTTETAPAPGTPARGPRMTPSDLRNLDELVREILGR--CTCPDQFP
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE1 VERLSQGRYRVGEK--ILFIRMLHNKHVMVRVGGGWETFAGYLLKHDPCRMLQISRVDGK
. ..:.:.::::.. ..:.:.:.. ::::::::::.:. :: ::::::
CCDS74 MIKVSEGKYRVGDSSLLIFVRVLRS-HVMVRVGGGWDTLEHYLDKHDPCRCSSTAHRPPQ
230 240 250 260 270 280
290 300 310
pF1KE1 TSPIQSKSPTLKDMNPDNYLVVSASYKAKKEIK
CCDS74 PRVCTFSPQRVSPTTSPRPASPVPGSERRGSRPEMTPVSLRSTKEGPETPPRPRDQLPPH
290 300 310 320 330 340
313 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 15:12:28 2016 done: Sun Nov 6 15:12:28 2016
Total Scan time: 2.890 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]