FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7163, 388 aa
1>>>pF1KB7163 388 - 388 aa - 388 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7564+/-0.00111; mu= 13.8524+/- 0.066
mean_var=58.7126+/-11.341, 0's: 0 Z-trim(101.3): 39 B-trim: 0 in 0/50
Lambda= 0.167382
statistics sampled from 6439 (6456) to 6439 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.566), E-opt: 0.2 (0.198), width: 16
Scan time: 1.910
The best scores are: opt bits E(32554)
CCDS97.1 ENO1 gene_id:2023|Hs108|chr1 ( 434) 2224 545.8 2.7e-155
CCDS11062.1 ENO3 gene_id:2027|Hs108|chr17 ( 434) 1895 466.3 2.3e-131
CCDS8570.1 ENO2 gene_id:2026|Hs108|chr12 ( 434) 1891 465.4 4.4e-131
CCDS54070.1 ENO3 gene_id:2027|Hs108|chr17 ( 391) 1421 351.9 5.8e-97
>>CCDS97.1 ENO1 gene_id:2023|Hs108|chr1 (434 aa)
initn: 2224 init1: 2224 opt: 2224 Z-score: 2901.4 bits: 545.8 E(32554): 2.7e-155
Smith-Waterman score: 2224; 88.7% identity (95.9% similar) in 388 aa overlap (1-388:1-388)
10 20 30 40 50 60
pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK
::::::::::.::::::::::::::::.:::::::::::::::::.:::.::::::::::
CCDS97 MSILKIHAREIFDSRGNPTVEVDLFTSKGLFRAAVPSGASTGIYEALELRDNDKTRYMGK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK
:::: :: :::::::.:::::::::::::::::::::::::::::::::::::::::.::
CCDS97 GVSKAVEHINKTIAPALVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAVCK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE
:.:::::::::.:::::.:::.::::::.::::::.::: .::::::::.::::::::::
CCDS97 AGAVEKGVPLYRHIADLAGNSEVILPVPAFNVINGGSHAGNKLAMQEFMILPVGAANFRE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV
:: :::::::.::::::::::::::.::: :.::::::::::::::::::::::::::::
CCDS97 AMRIGAEVYHNLKNVIKEKYGKDATNVGDEGGFAPNILENKEGLELLKTAIGKAGYTDKV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD
...::: ::::::::::::.:: :::.:::::: ::::::::::.::::: ::::::::
CCDS97 VIGMDVAASEFFRSGKYDLDFKSPDDPSRYISPDQLADLYKSFIKDYPVVSIEDPFDQDD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA
:::::::::::::::: ::: :::::: :.:::::.::::::::::: ::::::::::::
CCDS97 WGAWQKFTASAGIQVVGDDLTVTNPKRIAKAVNEKSCNCLLLKVNQIGSVTESLQACKLA
310 320 330 340 350 360
370 380
pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL
::::: ::: :.:::::.:::.::::::
CCDS97 QANGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLLRIEEELGSK
370 380 390 400 410 420
>>CCDS11062.1 ENO3 gene_id:2027|Hs108|chr17 (434 aa)
initn: 1895 init1: 1895 opt: 1895 Z-score: 2472.0 bits: 466.3 E(32554): 2.3e-131
Smith-Waterman score: 1895; 74.0% identity (91.5% similar) in 388 aa overlap (1-388:1-388)
10 20 30 40 50 60
pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK
:.. :: :::..:::::::::::: :..: :::::::::::::::.:::.:.:: ::.::
CCDS11 MAMQKIFAREILDSRGNPTVEVDLHTAKGRFRAAVPSGASTGIYEALELRDGDKGRYLGK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK
:: : :: ::.:..:.:..:::.:..:::.::.:::.::::::::::::::::::::.::
CCDS11 GVLKAVENINNTLGPALLQKKLSVVDQEKVDKFMIELDGTENKSKFGANAILGVSLAVCK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE
:.:.:::::::.:::::.:: .:::::.::::::.::: .::::::::.:::::..:.:
CCDS11 AGAAEKGVPLYRHIADLAGNPDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGASSFKE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV
:: ::::::: ::.::: :::::::.::: :.::::::::.:.:::::::: ::: :::
CCDS11 AMRIGAEVYHHLKGVIKAKYGKDATNVGDEGGFAPNILENNEALELLKTAIQAAGYPDKV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD
...::: ::::.:.:::::.:: :::.:.:. . :..::::::::::::: ::::::::
CCDS11 VIGMDVAASEFYRNGKYDLDFKSPDDPARHITGEKLGELYKSFIKNYPVVSIEDPFDQDD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA
:..: .: ....::.: ::: :::::: :.::..: ::::::::::: :::::.::::::
CCDS11 WATWTSFLSGVNIQIVGDDLTVTNPKRIAQAVEKKACNCLLLKVNQIGSVTESIQACKLA
310 320 330 340 350 360
370 380
pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL
:.::: ::: :.:::::.:::.::::::
CCDS11 QSNGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEALGDK
370 380 390 400 410 420
>>CCDS8570.1 ENO2 gene_id:2026|Hs108|chr12 (434 aa)
initn: 1891 init1: 1891 opt: 1891 Z-score: 2466.8 bits: 465.4 E(32554): 4.4e-131
Smith-Waterman score: 1891; 73.2% identity (91.5% similar) in 388 aa overlap (1-388:1-388)
10 20 30 40 50 60
pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK
::: :: :::..::::::::::::.:..:::::::::::::::::.:::.:.:: ::.::
CCDS85 MSIEKIWAREILDSRGNPTVEVDLYTAKGLFRAAVPSGASTGIYEALELRDGDKQRYLGK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK
:: : :. ::.::::.:.:. :.:.::::.:.::.:.::::::::::::::::::::.::
CCDS85 GVLKAVDHINSTIAPALISSGLSVVEQEKLDNLMLELDGTENKSKFGANAILGVSLAVCK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE
:.:.:. .:::.:::.:.::: .:::::.::::::.::: .::::::::.::::: .::.
CCDS85 AGAAERELPLYRHIAQLAGNSDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGAESFRD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV
:: .::::::.::.:::.:::::::.::: :.::::::::.:.:::.: :: :::::.:.
CCDS85 AMRLGAEVYHTLKGVIKDKYGKDATNVGDEGGFAPNILENSEALELVKEAIDKAGYTEKI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD
...::: ::::.:.:::::.:: ::.:::. : :. ::..:...::::: ::::::::
CCDS85 VIGMDVAASEFYRDGKYDLDFKSPTDPSRYITGDQLGALYQDFVRDYPVVSIEDPFDQDD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA
:.::.::::..:::.: ::: :::::: ::.:: ::::::::::: ::::..::::::
CCDS85 WAAWSKFTANVGIQIVGDDLTVTNPKRIERAVEEKACNCLLLKVNQIGSVTEAIQACKLA
310 320 330 340 350 360
370 380
pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL
: ::: ::: :.:::::.:::.::::::
CCDS85 QENGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEELGDE
370 380 390 400 410 420
>>CCDS54070.1 ENO3 gene_id:2027|Hs108|chr17 (391 aa)
initn: 1421 init1: 1421 opt: 1421 Z-score: 1854.2 bits: 351.9 E(32554): 5.8e-97
Smith-Waterman score: 1612; 66.5% identity (81.2% similar) in 388 aa overlap (1-388:1-345)
10 20 30 40 50 60
pF1KB7 MSILKIHARELFDSRGNPTVEVDLFTSEGLFRAAVPSGASTGIYEVLELQDNDKTRYMGK
:.. :: :::..:::::::::::: :..: :::::::::::::::.:::.:.:: ::.::
CCDS54 MAMQKIFAREILDSRGNPTVEVDLHTAKGRFRAAVPSGASTGIYEALELRDGDKGRYLGK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GVSKPVEPINKTIAPVLVSKKLNVTEQEKIDKLMIEMDGTENKSKFGANAILGVSLAACK
.:::::::::::::.::
CCDS54 -------------------------------------------AKFGANAILGVSLAVCK
70
130 140 150 160 170 180
pF1KB7 ASAVEKGVPLYHHIADLSGNSKVILPVPVFNVINGSSHAVTKLAMQEFMVLPVGAANFRE
:.:.:::::::.:::::.:: .:::::.::::::.::: .::::::::.:::::..:.:
CCDS54 AGAAEKGVPLYRHIADLAGNPDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGASSFKE
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB7 AMPIGAEVYHSLKNVIKEKYGKDATGVGDGGAFAPNILENKEGLELLKTAIGKAGYTDKV
:: ::::::: ::.::: :::::::.::: :.::::::::.:.:::::::: ::: :::
CCDS54 AMRIGAEVYHHLKGVIKAKYGKDATNVGDEGGFAPNILENNEALELLKTAIQAAGYPDKV
140 150 160 170 180 190
250 260 270 280 290 300
pF1KB7 IVSMDVEASEFFRSGKYDLEFKFLDDPTRYISPDCLADLYKSFIKNYPVVSTEDPFDQDD
...::: ::::.:.:::::.:: :::.:.:. . :..::::::::::::: ::::::::
CCDS54 VIGMDVAASEFYRNGKYDLDFKSPDDPARHITGEKLGELYKSFIKNYPVVSIEDPFDQDD
200 210 220 230 240 250
310 320 330 340 350 360
pF1KB7 WGAWQKFTASAGIQVVEDDLRVTNPKRTASAVNEKKCNCLLLKVNQIRSVTESLQACKLA
:..: .: ....::.: ::: :::::: :.::..: ::::::::::: :::::.::::::
CCDS54 WATWTSFLSGVNIQIVGDDLTVTNPKRIAQAVEKKACNCLLLKVNQIGSVTESIQACKLA
260 270 280 290 300 310
370 380
pF1KB7 QANGWCVMVPHHSGETENTFITDLVVGL
:.::: ::: :.:::::.:::.::::::
CCDS54 QSNGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEALGDK
320 330 340 350 360 370
388 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 00:55:01 2016 done: Sat Nov 5 00:55:01 2016
Total Scan time: 1.910 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]