FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9577, 543 aa
1>>>pF1KE9577 543 - 543 aa - 543 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.2318+/-0.000902; mu= 14.5068+/- 0.054
mean_var=91.4873+/-18.102, 0's: 0 Z-trim(107.9): 8 B-trim: 0 in 0/48
Lambda= 0.134089
statistics sampled from 9838 (9843) to 9838 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.658), E-opt: 0.2 (0.302), width: 16
Scan time: 3.480
The best scores are: opt bits E(32554)
CCDS42479.1 GPR108 gene_id:56927|Hs108|chr19 ( 543) 3576 702.1 4.2e-202
CCDS35162.1 GPR107 gene_id:57720|Hs108|chr9 ( 552) 1728 344.6 1.8e-94
CCDS48042.1 GPR107 gene_id:57720|Hs108|chr9 ( 571) 1227 247.7 2.7e-65
CCDS48041.1 GPR107 gene_id:57720|Hs108|chr9 ( 600) 1227 247.7 2.9e-65
>>CCDS42479.1 GPR108 gene_id:56927|Hs108|chr19 (543 aa)
initn: 3576 init1: 3576 opt: 3576 Z-score: 3741.8 bits: 702.1 E(32554): 4.2e-202
Smith-Waterman score: 3576; 99.8% identity (100.0% similar) in 543 aa overlap (1-543:1-543)
10 20 30 40 50 60
pF1KE9 MAVSERRGLGRGSPAEWGQRLLLVLLLGGCSGRIHRLALTGEKRADIQLNSFGFYTNGSL
:::::::::::::::::::::::::::::::::::.::::::::::::::::::::::::
CCDS42 MAVSERRGLGRGSPAEWGQRLLLVLLLGGCSGRIHQLALTGEKRADIQLNSFGFYTNGSL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 EVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKNSSSFLVLFLIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKNSSSFLVLFLIN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 TKDLQVQVRKYGEQKTLFIFPGLLPEAPSKPGLPKPQATVPRKVDGGGTSAASKPKSTPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TKDLQVQVRKYGEQKTLFIFPGLLPEAPSKPGLPKPQATVPRKVDGGGTSAASKPKSTPA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 VIQGPSGKDKDLVLGLSHLNNSYNFSFHVVIGSQAEEGQYSLNFHNCNNSVPGKEHPFDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VIQGPSGKDKDLVLGLSHLNNSYNFSFHVVIGSQAEEGQYSLNFHNCNNSVPGKEHPFDI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 TVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSILCRNTYSVFKIHWLMAALA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSILCRNTYSVFKIHWLMAALA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 FTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGALLFITIALIGSGWAFIKYVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 FTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGALLFITIALIGSGWAFIKYVL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 SDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEILFLVDLICCGAILFPVVWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEILFLVDLICCGAILFPVVWS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 IRHLQDASGTDGKVAVNLAKLKLFRHYYVMVICYVYFTRIIAILLQVAVPFQWQWLYQLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IRHLQDASGTDGKVAVNLAKLKLFRHYYVMVICYVYFTRIIAILLQVAVPFQWQWLYQLL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 VEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVMTDSGFREGLSKVNKTASGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVMTDSGFREGLSKVNKTASGR
490 500 510 520 530 540
pF1KE9 ELL
:::
CCDS42 ELL
>>CCDS35162.1 GPR107 gene_id:57720|Hs108|chr9 (552 aa)
initn: 1662 init1: 1361 opt: 1728 Z-score: 1809.6 bits: 344.6 E(32554): 1.8e-94
Smith-Waterman score: 1728; 52.1% identity (76.6% similar) in 547 aa overlap (12-539:8-540)
10 20 30 40
pF1KE9 MAVSERRGLGRGSPAEWGQRL-----------LLVLLLGGCSGRIHRLALTGEKRADIQL
:::: : :: :: :: ::.:.::: . : ..:
CCDS35 MAALAPVGSPASRGPRLAAGLRLLPMLGLLQLLAEPGLGRVHHLALKDDVRHKVHL
10 20 30 40 50
50 60 70 80 90 100
pF1KE9 NSFGFYTNGSLEVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKN
:.:::. .: . :..: :.: : :.:.. .::::.:... :: .: . : :.:.
CCDS35 NTFGFFKDGYMVVNVS--SLSLNEPEDKDVTIGFSLDRTKNDGFSSYLDEDVNYCILKKQ
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE9 SSSFLVLFL-INTKDLQVQVR-KYGEQKTLFIFP---GLLPEAPSKPGL-PKPQATVPRK
: : .:.: :. ....:. . : : .:: .: .. ..:.. : .. .:
CCDS35 SVSVTLLILDISRSEVRVKSPPEAGTQLPKIIFSRDEKVLGQS-QEPNVNPASAGNQTQK
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE9 VDGGGTSAASKPKSTPAVIQGPSGKDKDLVLGLSHLNN-SYNFSFHVVIGSQAEEGQYSL
.. :: :: ..... . .:.. . : :. . .:.: :... .:: :::
CCDS35 TQDGG-------KSKRSTVDSKAMGEKSFSV---HNNGGAVSFQFFFNISTDDQEGLYSL
180 190 200 210 220
230 240 250 260 270 280
pF1KE9 NFHNC-NNSVPGKEHPFDITVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSI
::.: .. .:. . :.. . : :::::..:::.:.:: :::. :. :. .: .:. :
CCDS35 YFHKCLGKELPSDKFTFSLDIEITEKNPDSYLSAGEIPLPKLYISMAFFFFLSGTIWIHI
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE9 LCRNTYSVFKIHWLMAALAFTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGAL
: . .::::::::::: ::::.::.::.:.:..:.::: :::: ::.:::.:::::::
CCDS35 LRKRRNDVFKIHWLMAALPFTKSLSLVFHAIDYHYISSQGFPIEGWAVVYYITHLLKGAL
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE9 LFITIALIGSGWAFIKYVLSDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEI
:::::::::.::::::..::::.::.: ::::.::::::::::::: :::...: :::.
CCDS35 LFITIALIGTGWAFIKHILSDKDKKIFMIVIPLQVLANVAYIIIESTEEGTTEYGLWKDS
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE9 LFLVDLICCGAILFPVVWSIRHLQDASGTDGKVAVNLAKLKLFRHYYVMVICYVYFTRII
::::::.:::::::::::::::::.::.::::.:.:::::::::::::...::.::::::
CCDS35 LFLVDLLCCGAILFPVVWSIRHLQEASATDGKAAINLAKLKLFRHYYVLIVCYIYFTRII
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE9 AILLQVAVPFQWQWLYQLLVEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVM
:.::..::::::.:::::: : .::.:::::::::.:...:::::: :: :::..::.:.
CCDS35 AFLLKLAVPFQWKWLYQLLDETATLVFFVLTGYKFRPASDNPYLQLSQE-EEDLEMESVV
470 480 490 500 510 520
530 540
pF1KE9 TDSGFREGLSKVNKTASGRELL
: :: :...::.:...:
CCDS35 TTSGVMESMKKVKKVTNGSVEPQGEWEGAV
530 540 550
>>CCDS48042.1 GPR107 gene_id:57720|Hs108|chr9 (571 aa)
initn: 1663 init1: 953 opt: 1227 Z-score: 1285.6 bits: 247.7 E(32554): 2.7e-65
Smith-Waterman score: 1680; 50.4% identity (74.0% similar) in 566 aa overlap (12-539:8-559)
10 20 30 40
pF1KE9 MAVSERRGLGRGSPAEWGQRL-----------LLVLLLGGCSGRIHRLALTGEKRADIQL
:::: : :: :: :: ::.:.::: . : ..:
CCDS48 MAALAPVGSPASRGPRLAAGLRLLPMLGLLQLLAEPGLGRVHHLALKDDVRHKVHL
10 20 30 40 50
50 60 70 80 90 100
pF1KE9 NSFGFYTNGSLEVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKN
:.:::. .: . :..: :.: : :.:.. .::::.:... :: .: . : :.:.
CCDS48 NTFGFFKDGYMVVNVS--SLSLNEPEDKDVTIGFSLDRTKNDGFSSYLDEDVNYCILKKQ
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE9 SSSFLVLFL-INTKDLQVQVR-KYGEQKTLFIFP---GLLPEAPSKPGL-PKPQATVPRK
: : .:.: :. ....:. . : : .:: .: .. ..:.. : .. .:
CCDS48 SVSVTLLILDISRSEVRVKSPPEAGTQLPKIIFSRDEKVLGQS-QEPNVNPASAGNQTQK
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE9 VDGGGTSAASKPKSTPAVIQGPSGKDKDLVLGLSHLNN-SYNFSFHVVIGSQAEEGQYSL
.. :: :: ..... . .:.. . : :. . .:.: :... .:: :::
CCDS48 TQDGG-------KSKRSTVDSKAMGEKSFSV---HNNGGAVSFQFFFNISTDDQEGLYSL
180 190 200 210 220
230 240 250 260 270 280
pF1KE9 NFHNC-NNSVPGKEHPFDITVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSI
::.: .. .:. . :.. . : :::::..:::.:.:: :::. :. :. .: .:. :
CCDS48 YFHKCLGKELPSDKFTFSLDIEITEKNPDSYLSAGEIPLPKLYISMAFFFFLSGTIWIHI
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE9 LCRNTYSVFKIHWLMAALAFTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGAL
: . .::::::::::: ::::.::.::.:.:..:.::: :::: ::.:::.:::::::
CCDS48 LRKRRNDVFKIHWLMAALPFTKSLSLVFHAIDYHYISSQGFPIEGWAVVYYITHLLKGAL
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE9 LFITIALIGSGWAFIKYVLSDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEI
:::::::::.::::::..::::.::.: ::::.::::::::::::: :::...: :::.
CCDS48 LFITIALIGTGWAFIKHILSDKDKKIFMIVIPLQVLANVAYIIIESTEEGTTEYGLWKDS
350 360 370 380 390 400
410 420 430 440
pF1KE9 LFLVDLICCGAILFPVVWSIRHLQDASGTDGK-------------------VAVNLAKLK
::::::.:::::::::::::::::.::.:::: .:.::::::
CCDS48 LFLVDLLCCGAILFPVVWSIRHLQEASATDGKGDSMGPLQQRANLRAGSRIAAINLAKLK
410 420 430 440 450 460
450 460 470 480 490 500
pF1KE9 LFRHYYVMVICYVYFTRIIAILLQVAVPFQWQWLYQLLVEGSTLAFFVLTGYKFQPTGNN
:::::::...::.:::::::.::..::::::.:::::: : .::.:::::::::.:...:
CCDS48 LFRHYYVLIVCYIYFTRIIAFLLKLAVPFQWKWLYQLLDETATLVFFVLTGYKFRPASDN
470 480 490 500 510 520
510 520 530 540
pF1KE9 PYLQLPQEDEEDVQMEQVMTDSGFREGLSKVNKTASGRELL
::::: :: :::..::.:.: :: :...::.:...:
CCDS48 PYLQLSQE-EEDLEMESVVTTSGVMESMKKVKKVTNGSVEPQGEWEGAV
530 540 550 560 570
>>CCDS48041.1 GPR107 gene_id:57720|Hs108|chr9 (600 aa)
initn: 1663 init1: 953 opt: 1227 Z-score: 1285.3 bits: 247.7 E(32554): 2.9e-65
Smith-Waterman score: 1593; 48.1% identity (69.9% similar) in 584 aa overlap (12-528:8-577)
10 20 30 40
pF1KE9 MAVSERRGLGRGSPAEWGQRL-----------LLVLLLGGCSGRIHRLALTGEKRADIQL
:::: : :: :: :: ::.:.::: . : ..:
CCDS48 MAALAPVGSPASRGPRLAAGLRLLPMLGLLQLLAEPGLGRVHHLALKDDVRHKVHL
10 20 30 40 50
50 60 70 80 90 100
pF1KE9 NSFGFYTNGSLEVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKN
:.:::. .: . :..: :.: : :.:.. .::::.:... :: .: . : :.:.
CCDS48 NTFGFFKDGYMVVNVS--SLSLNEPEDKDVTIGFSLDRTKNDGFSSYLDEDVNYCILKKQ
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE9 SSSFLVLFL-INTKDLQVQVR-KYGEQKTLFIFP---GLLPEAPSKPGL-PKPQATVPRK
: : .:.: :. ....:. . : : .:: .: .. ..:.. : .. .:
CCDS48 SVSVTLLILDISRSEVRVKSPPEAGTQLPKIIFSRDEKVLGQS-QEPNVNPASAGNQTQK
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE9 VDGGGTSAASKPKSTPAVIQGPSGKDKDLVLGLSHLNN-SYNFSFHVVIGSQAEEGQYSL
.. :: :: ..... . .:.. . : :. . .:.: :... .:: :::
CCDS48 TQDGG-------KSKRSTVDSKAMGEKSFSV---HNNGGAVSFQFFFNISTDDQEGLYSL
180 190 200 210 220
230 240 250 260 270 280
pF1KE9 NFHNC-NNSVPGKEHPFDITVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSI
::.: .. .:. . :.. . : :::::..:::.:.:: :::. :. :. .: .:. :
CCDS48 YFHKCLGKELPSDKFTFSLDIEITEKNPDSYLSAGEIPLPKLYISMAFFFFLSGTIWIHI
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE9 LCRNTYSVFKIHWLMAALAFTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGAL
: . .::::::::::: ::::.::.::.:.:..:.::: :::: ::.:::.:::::::
CCDS48 LRKRRNDVFKIHWLMAALPFTKSLSLVFHAIDYHYISSQGFPIEGWAVVYYITHLLKGAL
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE9 LFITIALIGSGWAFIKYVLSDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEI
:::::::::.::::::..::::.::.: ::::.::::::::::::: :::...: :::.
CCDS48 LFITIALIGTGWAFIKHILSDKDKKIFMIVIPLQVLANVAYIIIESTEEGTTEYGLWKDS
350 360 370 380 390 400
410 420 430
pF1KE9 LFLVDLICCGAILFPVVWSIRHLQDASGTDGK----------------------------
::::::.:::::::::::::::::.::.::::
CCDS48 LFLVDLLCCGAILFPVVWSIRHLQEASATDGKGDSMGPLQQRANLRAGSRIESHHFAQAD
410 420 430 440 450 460
440 450 460 470
pF1KE9 --------------------VAVNLAKLKLFRHYYVMVICYVYFTRIIAILLQVAVPFQW
.:.:::::::::::::...::.:::::::.::..::::::
CCDS48 LELLASSCPPASVSQRAGITAAINLAKLKLFRHYYVLIVCYIYFTRIIAFLLKLAVPFQW
470 480 490 500 510 520
480 490 500 510 520 530
pF1KE9 QWLYQLLVEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVMTDSGFREGLSKV
.:::::: : .::.:::::::::.:...:::::: :: :::..::.:.: :: :
CCDS48 KWLYQLLDETATLVFFVLTGYKFRPASDNPYLQLSQE-EEDLEMESVVTTSGVMESMKKV
530 540 550 560 570 580
540
pF1KE9 NKTASGRELL
CCDS48 KKVTNGSVEPQGEWEGAV
590 600
543 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 02:38:08 2016 done: Tue Nov 8 02:38:08 2016
Total Scan time: 3.480 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]