FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0513, 331 aa
1>>>pF1KE0513 331 - 331 aa - 331 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8026+/-0.000779; mu= 13.8465+/- 0.047
mean_var=74.2597+/-14.586, 0's: 0 Z-trim(108.2): 27 B-trim: 11 in 2/51
Lambda= 0.148832
statistics sampled from 10029 (10053) to 10029 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.689), E-opt: 0.2 (0.309), width: 16
Scan time: 2.030
The best scores are: opt bits E(32554)
CCDS14057.1 PARVG gene_id:64098|Hs108|chr22 ( 331) 2133 467.1 9e-132
CCDS58808.1 PARVB gene_id:29780|Hs108|chr22 ( 327) 863 194.4 1.1e-49
CCDS14056.1 PARVB gene_id:29780|Hs108|chr22 ( 364) 863 194.4 1.2e-49
CCDS46724.1 PARVB gene_id:29780|Hs108|chr22 ( 397) 863 194.4 1.3e-49
CCDS44541.2 PARVA gene_id:55742|Hs108|chr11 ( 412) 850 191.6 9.2e-49
CCDS74874.1 PARVB gene_id:29780|Hs108|chr22 ( 289) 513 119.2 4.1e-27
>>CCDS14057.1 PARVG gene_id:64098|Hs108|chr22 (331 aa)
initn: 2133 init1: 2133 opt: 2133 Z-score: 2479.2 bits: 467.1 E(32554): 9e-132
Smith-Waterman score: 2133; 100.0% identity (100.0% similar) in 331 aa overlap (1-331:1-331)
10 20 30 40 50 60
pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWINATLLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWINATLLP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 EHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVNRSLQLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 EHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVNRSLQLE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 EWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGLKSEKLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 EWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGLKSEKLV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 EQLTEYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSVQNLDTQFAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 EQLTEYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSVQNLDTQFAD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 GVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCPVSPEDIVNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCPVSPEDIVNK
250 260 270 280 290 300
310 320 330
pF1KE0 DAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
:::::::::::::::::::::::::::::::
CCDS14 DAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
310 320 330
>>CCDS58808.1 PARVB gene_id:29780|Hs108|chr22 (327 aa)
initn: 862 init1: 465 opt: 863 Z-score: 1005.6 bits: 194.4 E(32554): 1.1e-49
Smith-Waterman score: 863; 45.2% identity (78.7% similar) in 301 aa overlap (19-316:25-323)
10 20 30 40 50
pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWI
: . .: .. .. .. :::..::::.:: :::..::
CCDS58 MSDLQEEGKNAINSPMSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVKVLLDWI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 NATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVN
: .:. :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: .:::::.
CCDS58 NDVLVEERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQTVLEAVH
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 RSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGL
:. . : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:..... .. :
CCDS58 DLLRPRGWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVRKREGLL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 KSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSV
.: .. :.:: :. . : .:.:: :: ::.:...::.....:::..:..:.: :
CCDS58 HSSHISEELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVKKSLITFVNKHLNKLNLEV
190 200 210 220 230
240 250 260 270 280 290
pF1KE0 QNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCP
.:.::::::: :.::.: :: .:. :..:::::.: . .:::..:.::. : :: .
CCDS58 TELETQFADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDGGLKKPK
240 250 260 270 280 290
300 310 320 330
pF1KE0 VSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
. :::.:: : ::::::::.:: :.
CCDS58 ARPEDVVNLDLKSTLRVLYNLFTKYKNVE
300 310 320
>>CCDS14056.1 PARVB gene_id:29780|Hs108|chr22 (364 aa)
initn: 862 init1: 465 opt: 863 Z-score: 1004.8 bits: 194.4 E(32554): 1.2e-49
Smith-Waterman score: 863; 45.2% identity (78.7% similar) in 301 aa overlap (19-316:62-360)
10 20 30 40
pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQK
: . .: .. .. .. :::..::::.:: :
CCDS14 KRRAREVSDLQEEGKNAINSPMSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVK
40 50 60 70 80 90
50 60 70 80 90 100
pF1KE0 VLMEWINATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTV
::..::: .:. :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: .
CCDS14 VLLDWINDVLVEERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQT
100 110 120 130 140 150
110 120 130 140 150 160
pF1KE0 VLEAVNRSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIE
:::::. :. . : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:....
CCDS14 VLEAVHDLLRPRGWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVR
160 170 180 190 200 210
170 180 190 200 210 220
pF1KE0 STKSGLKSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLD
. .. :.: .. :.:: :. . : .:.:: :: ::.:...::.....:::..:.
CCDS14 KREGLLHSSHISEELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVKKSLITFVNKHLN
220 230 240 250 260
230 240 250 260 270 280
pF1KE0 RLGLSVQNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDE
.:.: : .:.::::::: :.::.: :: .:. :..:::::.: . .:::..:.::. :
CCDS14 KLNLEVTELETQFADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDG
270 280 290 300 310 320
290 300 310 320 330
pF1KE0 GLLSCPVSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
:: . . :::.:: : ::::::::.:: :.
CCDS14 GLKKPKARPEDVVNLDLKSTLRVLYNLFTKYKNVE
330 340 350 360
>>CCDS46724.1 PARVB gene_id:29780|Hs108|chr22 (397 aa)
initn: 862 init1: 465 opt: 863 Z-score: 1004.3 bits: 194.4 E(32554): 1.3e-49
Smith-Waterman score: 863; 45.2% identity (78.7% similar) in 301 aa overlap (19-316:95-393)
10 20 30 40
pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQK
: . .: .. .. .. :::..::::.:: :
CCDS46 EYAQGGVSDLQEEGKNAINSPMSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVK
70 80 90 100 110 120
50 60 70 80 90 100
pF1KE0 VLMEWINATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTV
::..::: .:. :.:.:..::::..:: .:..:...::. ::.. ... . .::.:: .
CCDS46 VLLDWINDVLVEERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQT
130 140 150 160 170 180
110 120 130 140 150 160
pF1KE0 VLEAVNRSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIE
:::::. :. . : .:::.:: .:.:.. :::::.:: .:. . :: .: :.:....
CCDS46 VLEAVHDLLRPRGWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVR
190 200 210 220 230 240
170 180 190 200 210 220
pF1KE0 STKSGLKSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLD
. .. :.: .. :.:: :. . : .:.:: :: ::.:...::.....:::..:.
CCDS46 KREGLLHSSHISEELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVKKSLITFVNKHLN
250 260 270 280 290 300
230 240 250 260 270 280
pF1KE0 RLGLSVQNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDE
.:.: : .:.::::::: :.::.: :: .:. :..:::::.: . .:::..:.::. :
CCDS46 KLNLEVTELETQFADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDG
310 320 330 340 350 360
290 300 310 320 330
pF1KE0 GLLSCPVSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
:: . . :::.:: : ::::::::.:: :.
CCDS46 GLKKPKARPEDVVNLDLKSTLRVLYNLFTKYKNVE
370 380 390
>>CCDS44541.2 PARVA gene_id:55742|Hs108|chr11 (412 aa)
initn: 885 init1: 427 opt: 850 Z-score: 988.9 bits: 191.6 E(32554): 9.2e-49
Smith-Waterman score: 850; 43.5% identity (78.1% similar) in 301 aa overlap (19-316:110-408)
10 20 30 40
pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQK
: . : .. . .. :.::.:::..::.:
CCDS44 RKKAKEVSELQEEGMNAINLPLSPIPFELDPEDTMLEENEVRTMVDPNSRSDPKLQELMK
80 90 100 110 120 130
50 60 70 80 90 100
pF1KE0 VLMEWINATLLPEHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTV
::..::: .:. :.:.:..: ::..:: .:..::..: . ::.. ... . .::.:: .
CCDS44 VLIDWINDVLVGERIIVKDLAEDLYDGQVLQKLFEKLESEKLNVAEVTQSEIAQKQKLQT
140 150 160 170 180 190
110 120 130 140 150 160
pF1KE0 VLEAVNRSLQLEEWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIE
::: .:..:.: . ::.:.:. :.:.. :::::::.. :. . :: .:...:....
CCDS44 VLEKINETLKLPPRSIKWNVDSVHAKSLVAILHLLVALSQYFRAPIRLPDHVSIQVVVVQ
200 210 220 230 240 250
170 180 190 200 210 220
pF1KE0 STKSGLKSEKLVEQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLD
. .. :.:... :..: : . . : .:.:: :: ::.:.:.::.....:::..:.
CCDS44 KREGILQSRQIQEEITGNTEALSGRHE--RDAFDTLFDHAPDKLNVVKKTLITFVNKHLN
260 270 280 290 300 310
230 240 250 260 270 280
pF1KE0 RLGLSVQNLDTQFADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDE
.:.: : .:.::::::: :.::.: :::.:. :. :.:::.: . . ::..:.::..:
CCDS44 KLNLEVTELETQFADGVYLVLLMGLLEGYFVPLHSFFLTPDSFEQKVLNVSFAFELMQDG
320 330 340 350 360 370
290 300 310 320 330
pF1KE0 GLLSCPVSPEDIVNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
:: . :::::: : ::::::::.:: :.
CCDS44 GLEKPKPRPEDIVNCDLKSTLRVLYNLFTKYRNVE
380 390 400 410
>>CCDS74874.1 PARVB gene_id:29780|Hs108|chr22 (289 aa)
initn: 777 init1: 465 opt: 513 Z-score: 600.2 bits: 119.2 E(32554): 4.1e-27
Smith-Waterman score: 737; 41.9% identity (71.8% similar) in 301 aa overlap (19-316:10-285)
10 20 30 40 50 60
pF1KE0 MEPEFLYDLLQLPKGVEPPAEEELSKGGKKKYLPPTSRKDPKFEELQKVLMEWINATLLP
: . .: .. .. .. :::..::::.:: :::..::: .:.
CCDS74 MSPALVDVHPEDTQLEENEERTMIDPTSKEDPKFKELVKVLLDWINDVLVE
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 EHIVVRSLEEDMFDGLILHHLFQRLAALKLEAEDIALTATSQKHKLTVVLEAVNRSLQLE
:.:.:..::::..:: .:..:...::. ::.. ... . .::.:: .:::::. :. .
CCDS74 ERIIVKQLEEDLYDGQVLQKLLEKLAGCKLNVAEVTQSEIGQKQKLQTVLEAVHDLLRPR
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 EWQAKWSVESIFNKDLLSTLHLLVALAKRFQPDLSLPTNVQVEVITIESTKSGLKSEKLV
: .:::.:: .:.:.. :::::.:: .:. . :: .: :.:..... .. :.: ..
CCDS74 GWALRWSVDSIHGKNLVAILHLLVSLAMHFRAPIRLPEHVTVQVVVVRKREGLLHSSHIS
120 130 140 150 160 170
190 200 210 220 230
pF1KE0 EQLT---EYSTDKDEPPKDVFDELFKLAPEKVNAVKEAIVNFVNQKLDRLGLSVQNLDTQ
:.:: :. . : .:.:: :: ::.:...:: .
CCDS74 EELTTTTEMMMGRFE--RDAFDTLFDHAPDKLSVVK-----------------------K
180 190 200
240 250 260 270 280 290
pF1KE0 FADGVILLLLIGQLEGFFLHLKEFYLTPNSPAEMLHNVTLALELLKDEGLLSCPVSPEDI
::::: :.::.: :: .:. :..:::::.: . .:::..:.::. : :: . . :::.
CCDS74 FADGVYLVLLMGLLEDYFVPLHHFYLTPESFDQKVHNVSFAFELMLDGGLKKPKARPEDV
210 220 230 240 250 260
300 310 320 330
pF1KE0 VNKDAKSTLRVLYGLFCKHTQKAHRDRTPHGAPN
:: : ::::::::.:: :.
CCDS74 VNLDLKSTLRVLYNLFTKYKNVE
270 280
331 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 03:00:49 2016 done: Thu Nov 3 03:00:49 2016
Total Scan time: 2.030 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]