FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0452, 462 aa
1>>>pF1KE0452 462 - 462 aa - 462 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9512+/- 0.001; mu= 13.9234+/- 0.060
mean_var=68.1104+/-13.670, 0's: 0 Z-trim(104.4): 18 B-trim: 307 in 1/50
Lambda= 0.155406
statistics sampled from 7873 (7877) to 7873 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.609), E-opt: 0.2 (0.242), width: 16
Scan time: 2.920
The best scores are: opt bits E(32554)
CCDS5032.1 MANEA gene_id:79694|Hs108|chr6 ( 462) 3152 716.0 2.1e-206
CCDS44110.1 MANEAL gene_id:149175|Hs108|chr1 ( 457) 1874 429.4 3.7e-120
CCDS426.1 MANEAL gene_id:149175|Hs108|chr1 ( 235) 1079 251.1 9e-67
CCDS44111.1 MANEAL gene_id:149175|Hs108|chr1 ( 250) 804 189.5 3.5e-48
>>CCDS5032.1 MANEA gene_id:79694|Hs108|chr6 (462 aa)
initn: 3152 init1: 3152 opt: 3152 Z-score: 3819.2 bits: 716.0 E(32554): 2.1e-206
Smith-Waterman score: 3152; 99.8% identity (99.8% similar) in 462 aa overlap (1-462:1-462)
10 20 30 40 50 60
pF1KE0 MAKFRRRTCIILALFILFIFSLMMGLKMLRPNTATFGAPFGLDLLPELHQRTIHLGKNFD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 MAKFRRRTCIILALFILFIFSLMMGLKMLRPNTATFGAPFGLDLLPELHQRTIHLGKNFD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 FQKSDRINSETNTKNLKSVEITMKPSKASELNLDELPPLNNYLHVFYYSWYGNPQFDGKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 FQKSDRINSETNTKNLKSVEITMKPSKASELNLDELPPLNNYLHVFYYSWYGNPQFDGKY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 IHWNHPVLGHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQMRSAS
:::::::: :::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IHWNHPVLEHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQMRSAS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 IGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYKNVKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYKNVKY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 IIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYDGLFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYDGLFI
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 ALLVEEKHKYDILQSGFDGIYTYFATNGFTYGSSHQNWASLKLFCDKYNLIFIPSVGPGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 ALLVEEKHKYDILQSGFDGIYTYFATNGFTYGSSHQNWASLKLFCDKYNLIFIPSVGPGY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 IDTSIRPWNTQNTRNRINGKYYEIGLSAALQTRPSLISITSFNEWHEGTQIEKAVPKRTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS50 IDTSIRPWNTQNTRNRINGKYYEIGLSAALQTRPSLISITSFNEWHEGTQIEKAVPKRTS
370 380 390 400 410 420
430 440 450 460
pF1KE0 NTVYLDYRPHKPGLYLELTRKWSEKYSKERATYALDRQLPVS
::::::::::::::::::::::::::::::::::::::::::
CCDS50 NTVYLDYRPHKPGLYLELTRKWSEKYSKERATYALDRQLPVS
430 440 450 460
>>CCDS44110.1 MANEAL gene_id:149175|Hs108|chr1 (457 aa)
initn: 1927 init1: 1803 opt: 1874 Z-score: 2270.7 bits: 429.4 E(32554): 3.7e-120
Smith-Waterman score: 1874; 57.3% identity (80.0% similar) in 459 aa overlap (1-455:1-457)
10 20 30 40 50
pF1KE0 MAKFRRRTCIILALFILFIFSLMMGLKMLR-PNTATFGAPFGLDLLPELHQRTIHLGKNF
::. :::.:: : : .:: :. .:::. :. :. .: ::.: : ...:
CCDS44 MARRRRRACIALFLVLLFAFGTLMGLRTLKAPDGLPALGP-GLELAP-FERRPEGAPAPA
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 DFQKSDRINSETNTKNLKSVEITMKPSKA-SELNLDELPPLNNY--LHVFYYSWYGNPQF
. .... .:. : .: . . : : ::.:::::::.:.
CCDS44 ARAPAAPAAPPPPPPPPRTADPGGSPGPAPAEAEPAPVQSLRVYSDLHAFYYSWYGSPRR
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 DGKYIHWNHPVLGHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQM
.:.::::.: .. ::::.:. .::.:::.::::.::::::::: :::::: :.. :: :.
CCDS44 EGHYIHWDHVMVPHWDPKISASYPRGRHSPPDDLGSSFYPELGPYSSRDPEVLREHMTQL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 RSASIGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYK
. :.::::.:::::: . :.::::.:.:::.::: ::.:...:.:::.::..::: ...
CCDS44 KEAAIGVLVLSWYPPGMADDNGEPSDDLVPAILDTAHQYSIQVAFHIQPYKGRDDITVHD
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 NVKYIIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYD
:.::::: ::.: ::::::.. :..::.::.::::.:.:: ::.::: .: .::::.:::
CCDS44 NIKYIIDTYGSHGAFYRYKNSMGKSLPLFYIYDSYLTSPEAWAHLLTPNGPHSIRNTPYD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE0 GLFIALLVEEKHKYDILQSGFDGIYTYFATNGFTYGSSHQNWASLKLFCDKYNLIFIPSV
:.:::::::: : .::: .::::.:::::.:::..::::::: ..: ::: ::.:::::
CCDS44 GVFIALLVEEGHTHDILAAGFDGMYTYFASNGFSFGSSHQNWKAVKNFCDANNLMFIPSV
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE0 GPGYIDTSIRPWNTQNTRNRINGKYYEIGLSAALQTRPSLISITSFNEWHEGTQIEKAVP
:::::::::::::..:::::.:::::: .:.::: .:: ..:::::::::::::::::.:
CCDS44 GPGYIDTSIRPWNNHNTRNRVNGKYYETALQAALTVRPEIVSITSFNEWHEGTQIEKAIP
360 370 380 390 400 410
420 430 440 450 460
pF1KE0 KRTSNTVYLDYRPHKPGLYLELTRKWSEKYSKERATYALDRQLPVS
:.: . .:::: ::.:.:::::::.:.:.. ::. . .
CCDS44 KKTPTRLYLDYLPHQPSLYLELTRRWAEHFIKEKEQWLM
420 430 440 450
>>CCDS426.1 MANEAL gene_id:149175|Hs108|chr1 (235 aa)
initn: 1076 init1: 1076 opt: 1079 Z-score: 1312.2 bits: 251.1 E(32554): 9e-67
Smith-Waterman score: 1079; 68.4% identity (89.6% similar) in 212 aa overlap (244-455:24-235)
220 230 240 250 260 270
pF1KE0 KYNLKVTFHIEPYSNRDDQNMYKNVKYIIDKYGNHPAFYRYKTKTGNALPMFYVYDSYIT
.::.: ::::::.. :..::.::.::::.:
CCDS42 MITGSPQMTWCPPFWTPPISTASRYGSHGAFYRYKNSMGKSLPLFYIYDSYLT
10 20 30 40 50
280 290 300 310 320 330
pF1KE0 KPEKWANLLTTSGSRSIRNSPYDGLFIALLVEEKHKYDILQSGFDGIYTYFATNGFTYGS
.:: ::.::: .: .::::.::::.:::::::: : .::: .::::.:::::.:::..::
CCDS42 SPEAWAHLLTPNGPHSIRNTPYDGVFIALLVEEGHTHDILAAGFDGMYTYFASNGFSFGS
60 70 80 90 100 110
340 350 360 370 380 390
pF1KE0 SHQNWASLKLFCDKYNLIFIPSVGPGYIDTSIRPWNTQNTRNRINGKYYEIGLSAALQTR
::::: ..: ::: ::.::::::::::::::::::..:::::.:::::: .:.::: .:
CCDS42 SHQNWKAVKNFCDANNLMFIPSVGPGYIDTSIRPWNNHNTRNRVNGKYYETALQAALTVR
120 130 140 150 160 170
400 410 420 430 440 450
pF1KE0 PSLISITSFNEWHEGTQIEKAVPKRTSNTVYLDYRPHKPGLYLELTRKWSEKYSKERATY
: ..:::::::::::::::::.::.: . .:::: ::.:.:::::::.:.:.. ::. .
CCDS42 PEIVSITSFNEWHEGTQIEKAIPKKTPTRLYLDYLPHQPSLYLELTRRWAEHFIKEKEQW
180 190 200 210 220 230
460
pF1KE0 ALDRQLPVS
.
CCDS42 LM
>>CCDS44111.1 MANEAL gene_id:149175|Hs108|chr1 (250 aa)
initn: 857 init1: 733 opt: 804 Z-score: 978.6 bits: 189.5 E(32554): 3.5e-48
Smith-Waterman score: 804; 47.6% identity (71.6% similar) in 250 aa overlap (1-246:1-248)
10 20 30 40 50
pF1KE0 MAKFRRRTCIILALFILFIFSLMMGLKMLR-PNTATFGAPFGLDLLPELHQRTIHLGKNF
::. :::.:: : : .:: :. .:::. :. :. .: ::.: : ...:
CCDS44 MARRRRRACIALFLVLLFAFGTLMGLRTLKAPDGLPALGP-GLELAP-FERRPEGAPAPA
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 DFQKSDRINSETNTKNLKSVEITMKPSKA-SELNLDELPPLNNY--LHVFYYSWYGNPQF
. .... .:. : .: . . : : ::.:::::::.:.
CCDS44 ARAPAAPAAPPPPPPPPRTADPGGSPGPAPAEAEPAPVQSLRVYSDLHAFYYSWYGSPRR
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 DGKYIHWNHPVLGHWDPRIAKNYPQGRHNPPDDIGSSFYPELGSYSSRDPSVIETHMRQM
.:.::::.: .. ::::.:. .::.:::.::::.::::::::: :::::: :.. :: :.
CCDS44 EGHYIHWDHVMVPHWDPKISASYPRGRHSPPDDLGSSFYPELGPYSSRDPEVLREHMTQL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 RSASIGVLALSWYPPDVNDENGEPTDNLVPTILDKAHKYNLKVTFHIEPYSNRDDQNMYK
. :.::::.:::::: . :.::::.:.:::.::: ::.:...:.:::.::..::: ...
CCDS44 KEAAIGVLVLSWYPPGMADDNGEPSDDLVPAILDTAHQYSIQVAFHIQPYKGRDDITVHD
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 NVKYIIDKYGNHPAFYRYKTKTGNALPMFYVYDSYITKPEKWANLLTTSGSRSIRNSPYD
:.::::: :
CCDS44 NIKYIIDTTGKL
240 250
462 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 07:51:19 2016 done: Thu Nov 3 07:51:20 2016
Total Scan time: 2.920 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]