FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9577, 543 aa 1>>>pF1KE9577 543 - 543 aa - 543 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2318+/-0.000902; mu= 14.5068+/- 0.054 mean_var=91.4873+/-18.102, 0's: 0 Z-trim(107.9): 8 B-trim: 0 in 0/48 Lambda= 0.134089 statistics sampled from 9838 (9843) to 9838 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.658), E-opt: 0.2 (0.302), width: 16 Scan time: 3.480 The best scores are: opt bits E(32554) CCDS42479.1 GPR108 gene_id:56927|Hs108|chr19 ( 543) 3576 702.1 4.2e-202 CCDS35162.1 GPR107 gene_id:57720|Hs108|chr9 ( 552) 1728 344.6 1.8e-94 CCDS48042.1 GPR107 gene_id:57720|Hs108|chr9 ( 571) 1227 247.7 2.7e-65 CCDS48041.1 GPR107 gene_id:57720|Hs108|chr9 ( 600) 1227 247.7 2.9e-65 >>CCDS42479.1 GPR108 gene_id:56927|Hs108|chr19 (543 aa) initn: 3576 init1: 3576 opt: 3576 Z-score: 3741.8 bits: 702.1 E(32554): 4.2e-202 Smith-Waterman score: 3576; 99.8% identity (100.0% similar) in 543 aa overlap (1-543:1-543) 10 20 30 40 50 60 pF1KE9 MAVSERRGLGRGSPAEWGQRLLLVLLLGGCSGRIHRLALTGEKRADIQLNSFGFYTNGSL :::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS42 MAVSERRGLGRGSPAEWGQRLLLVLLLGGCSGRIHQLALTGEKRADIQLNSFGFYTNGSL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 EVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKNSSSFLVLFLIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 EVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKNSSSFLVLFLIN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 TKDLQVQVRKYGEQKTLFIFPGLLPEAPSKPGLPKPQATVPRKVDGGGTSAASKPKSTPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TKDLQVQVRKYGEQKTLFIFPGLLPEAPSKPGLPKPQATVPRKVDGGGTSAASKPKSTPA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 VIQGPSGKDKDLVLGLSHLNNSYNFSFHVVIGSQAEEGQYSLNFHNCNNSVPGKEHPFDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VIQGPSGKDKDLVLGLSHLNNSYNFSFHVVIGSQAEEGQYSLNFHNCNNSVPGKEHPFDI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 TVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSILCRNTYSVFKIHWLMAALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSILCRNTYSVFKIHWLMAALA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 FTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGALLFITIALIGSGWAFIKYVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 FTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGALLFITIALIGSGWAFIKYVL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 SDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEILFLVDLICCGAILFPVVWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEILFLVDLICCGAILFPVVWS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 IRHLQDASGTDGKVAVNLAKLKLFRHYYVMVICYVYFTRIIAILLQVAVPFQWQWLYQLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 IRHLQDASGTDGKVAVNLAKLKLFRHYYVMVICYVYFTRIIAILLQVAVPFQWQWLYQLL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 VEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVMTDSGFREGLSKVNKTASGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVMTDSGFREGLSKVNKTASGR 490 500 510 520 530 540 pF1KE9 ELL ::: CCDS42 ELL >>CCDS35162.1 GPR107 gene_id:57720|Hs108|chr9 (552 aa) initn: 1662 init1: 1361 opt: 1728 Z-score: 1809.6 bits: 344.6 E(32554): 1.8e-94 Smith-Waterman score: 1728; 52.1% identity (76.6% similar) in 547 aa overlap (12-539:8-540) 10 20 30 40 pF1KE9 MAVSERRGLGRGSPAEWGQRL-----------LLVLLLGGCSGRIHRLALTGEKRADIQL :::: : :: :: :: ::.:.::: . : ..: CCDS35 MAALAPVGSPASRGPRLAAGLRLLPMLGLLQLLAEPGLGRVHHLALKDDVRHKVHL 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 NSFGFYTNGSLEVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKN :.:::. .: . :..: :.: : :.:.. .::::.:... :: .: . : :.:. CCDS35 NTFGFFKDGYMVVNVS--SLSLNEPEDKDVTIGFSLDRTKNDGFSSYLDEDVNYCILKKQ 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 SSSFLVLFL-INTKDLQVQVR-KYGEQKTLFIFP---GLLPEAPSKPGL-PKPQATVPRK : : .:.: :. ....:. . : : .:: .: .. ..:.. : .. .: CCDS35 SVSVTLLILDISRSEVRVKSPPEAGTQLPKIIFSRDEKVLGQS-QEPNVNPASAGNQTQK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE9 VDGGGTSAASKPKSTPAVIQGPSGKDKDLVLGLSHLNN-SYNFSFHVVIGSQAEEGQYSL .. :: :: ..... . .:.. . : :. . .:.: :... .:: ::: CCDS35 TQDGG-------KSKRSTVDSKAMGEKSFSV---HNNGGAVSFQFFFNISTDDQEGLYSL 180 190 200 210 220 230 240 250 260 270 280 pF1KE9 NFHNC-NNSVPGKEHPFDITVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSI ::.: .. .:. . :.. . : :::::..:::.:.:: :::. :. :. .: .:. : CCDS35 YFHKCLGKELPSDKFTFSLDIEITEKNPDSYLSAGEIPLPKLYISMAFFFFLSGTIWIHI 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE9 LCRNTYSVFKIHWLMAALAFTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGAL : . .::::::::::: ::::.::.::.:.:..:.::: :::: ::.:::.::::::: CCDS35 LRKRRNDVFKIHWLMAALPFTKSLSLVFHAIDYHYISSQGFPIEGWAVVYYITHLLKGAL 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE9 LFITIALIGSGWAFIKYVLSDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEI :::::::::.::::::..::::.::.: ::::.::::::::::::: :::...: :::. CCDS35 LFITIALIGTGWAFIKHILSDKDKKIFMIVIPLQVLANVAYIIIESTEEGTTEYGLWKDS 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE9 LFLVDLICCGAILFPVVWSIRHLQDASGTDGKVAVNLAKLKLFRHYYVMVICYVYFTRII ::::::.:::::::::::::::::.::.::::.:.:::::::::::::...::.:::::: CCDS35 LFLVDLLCCGAILFPVVWSIRHLQEASATDGKAAINLAKLKLFRHYYVLIVCYIYFTRII 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE9 AILLQVAVPFQWQWLYQLLVEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVM :.::..::::::.:::::: : .::.:::::::::.:...:::::: :: :::..::.:. CCDS35 AFLLKLAVPFQWKWLYQLLDETATLVFFVLTGYKFRPASDNPYLQLSQE-EEDLEMESVV 470 480 490 500 510 520 530 540 pF1KE9 TDSGFREGLSKVNKTASGRELL : :: :...::.:...: CCDS35 TTSGVMESMKKVKKVTNGSVEPQGEWEGAV 530 540 550 >>CCDS48042.1 GPR107 gene_id:57720|Hs108|chr9 (571 aa) initn: 1663 init1: 953 opt: 1227 Z-score: 1285.6 bits: 247.7 E(32554): 2.7e-65 Smith-Waterman score: 1680; 50.4% identity (74.0% similar) in 566 aa overlap (12-539:8-559) 10 20 30 40 pF1KE9 MAVSERRGLGRGSPAEWGQRL-----------LLVLLLGGCSGRIHRLALTGEKRADIQL :::: : :: :: :: ::.:.::: . : ..: CCDS48 MAALAPVGSPASRGPRLAAGLRLLPMLGLLQLLAEPGLGRVHHLALKDDVRHKVHL 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 NSFGFYTNGSLEVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKN :.:::. .: . :..: :.: : :.:.. .::::.:... :: .: . : :.:. CCDS48 NTFGFFKDGYMVVNVS--SLSLNEPEDKDVTIGFSLDRTKNDGFSSYLDEDVNYCILKKQ 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 SSSFLVLFL-INTKDLQVQVR-KYGEQKTLFIFP---GLLPEAPSKPGL-PKPQATVPRK : : .:.: :. ....:. . : : .:: .: .. ..:.. : .. .: CCDS48 SVSVTLLILDISRSEVRVKSPPEAGTQLPKIIFSRDEKVLGQS-QEPNVNPASAGNQTQK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE9 VDGGGTSAASKPKSTPAVIQGPSGKDKDLVLGLSHLNN-SYNFSFHVVIGSQAEEGQYSL .. :: :: ..... . .:.. . : :. . .:.: :... .:: ::: CCDS48 TQDGG-------KSKRSTVDSKAMGEKSFSV---HNNGGAVSFQFFFNISTDDQEGLYSL 180 190 200 210 220 230 240 250 260 270 280 pF1KE9 NFHNC-NNSVPGKEHPFDITVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSI ::.: .. .:. . :.. . : :::::..:::.:.:: :::. :. :. .: .:. : CCDS48 YFHKCLGKELPSDKFTFSLDIEITEKNPDSYLSAGEIPLPKLYISMAFFFFLSGTIWIHI 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE9 LCRNTYSVFKIHWLMAALAFTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGAL : . .::::::::::: ::::.::.::.:.:..:.::: :::: ::.:::.::::::: CCDS48 LRKRRNDVFKIHWLMAALPFTKSLSLVFHAIDYHYISSQGFPIEGWAVVYYITHLLKGAL 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE9 LFITIALIGSGWAFIKYVLSDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEI :::::::::.::::::..::::.::.: ::::.::::::::::::: :::...: :::. CCDS48 LFITIALIGTGWAFIKHILSDKDKKIFMIVIPLQVLANVAYIIIESTEEGTTEYGLWKDS 350 360 370 380 390 400 410 420 430 440 pF1KE9 LFLVDLICCGAILFPVVWSIRHLQDASGTDGK-------------------VAVNLAKLK ::::::.:::::::::::::::::.::.:::: .:.:::::: CCDS48 LFLVDLLCCGAILFPVVWSIRHLQEASATDGKGDSMGPLQQRANLRAGSRIAAINLAKLK 410 420 430 440 450 460 450 460 470 480 490 500 pF1KE9 LFRHYYVMVICYVYFTRIIAILLQVAVPFQWQWLYQLLVEGSTLAFFVLTGYKFQPTGNN :::::::...::.:::::::.::..::::::.:::::: : .::.:::::::::.:...: CCDS48 LFRHYYVLIVCYIYFTRIIAFLLKLAVPFQWKWLYQLLDETATLVFFVLTGYKFRPASDN 470 480 490 500 510 520 510 520 530 540 pF1KE9 PYLQLPQEDEEDVQMEQVMTDSGFREGLSKVNKTASGRELL ::::: :: :::..::.:.: :: :...::.:...: CCDS48 PYLQLSQE-EEDLEMESVVTTSGVMESMKKVKKVTNGSVEPQGEWEGAV 530 540 550 560 570 >>CCDS48041.1 GPR107 gene_id:57720|Hs108|chr9 (600 aa) initn: 1663 init1: 953 opt: 1227 Z-score: 1285.3 bits: 247.7 E(32554): 2.9e-65 Smith-Waterman score: 1593; 48.1% identity (69.9% similar) in 584 aa overlap (12-528:8-577) 10 20 30 40 pF1KE9 MAVSERRGLGRGSPAEWGQRL-----------LLVLLLGGCSGRIHRLALTGEKRADIQL :::: : :: :: :: ::.:.::: . : ..: CCDS48 MAALAPVGSPASRGPRLAAGLRLLPMLGLLQLLAEPGLGRVHHLALKDDVRHKVHL 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 NSFGFYTNGSLEVELSVLRLGLREAEEKSLLVGFSLSRVRSGRVRSYSTRDFQDCPLQKN :.:::. .: . :..: :.: : :.:.. .::::.:... :: .: . : :.:. CCDS48 NTFGFFKDGYMVVNVS--SLSLNEPEDKDVTIGFSLDRTKNDGFSSYLDEDVNYCILKKQ 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 SSSFLVLFL-INTKDLQVQVR-KYGEQKTLFIFP---GLLPEAPSKPGL-PKPQATVPRK : : .:.: :. ....:. . : : .:: .: .. ..:.. : .. .: CCDS48 SVSVTLLILDISRSEVRVKSPPEAGTQLPKIIFSRDEKVLGQS-QEPNVNPASAGNQTQK 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE9 VDGGGTSAASKPKSTPAVIQGPSGKDKDLVLGLSHLNN-SYNFSFHVVIGSQAEEGQYSL .. :: :: ..... . .:.. . : :. . .:.: :... .:: ::: CCDS48 TQDGG-------KSKRSTVDSKAMGEKSFSV---HNNGGAVSFQFFFNISTDDQEGLYSL 180 190 200 210 220 230 240 250 260 270 280 pF1KE9 NFHNC-NNSVPGKEHPFDITVMIREKNPDGFLSAAEMPLFKLYMVMSACFLAAGIFWVSI ::.: .. .:. . :.. . : :::::..:::.:.:: :::. :. :. .: .:. : CCDS48 YFHKCLGKELPSDKFTFSLDIEITEKNPDSYLSAGEIPLPKLYISMAFFFFLSGTIWIHI 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE9 LCRNTYSVFKIHWLMAALAFTKSISLLFHSINYYFINSQGHPIEGLAVMYYIAHLLKGAL : . .::::::::::: ::::.::.::.:.:..:.::: :::: ::.:::.::::::: CCDS48 LRKRRNDVFKIHWLMAALPFTKSLSLVFHAIDYHYISSQGFPIEGWAVVYYITHLLKGAL 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE9 LFITIALIGSGWAFIKYVLSDKEKKVFGIVIPMQVLANVAYIIIESREEGASDYVLWKEI :::::::::.::::::..::::.::.: ::::.::::::::::::: :::...: :::. CCDS48 LFITIALIGTGWAFIKHILSDKDKKIFMIVIPLQVLANVAYIIIESTEEGTTEYGLWKDS 350 360 370 380 390 400 410 420 430 pF1KE9 LFLVDLICCGAILFPVVWSIRHLQDASGTDGK---------------------------- ::::::.:::::::::::::::::.::.:::: CCDS48 LFLVDLLCCGAILFPVVWSIRHLQEASATDGKGDSMGPLQQRANLRAGSRIESHHFAQAD 410 420 430 440 450 460 440 450 460 470 pF1KE9 --------------------VAVNLAKLKLFRHYYVMVICYVYFTRIIAILLQVAVPFQW .:.:::::::::::::...::.:::::::.::..:::::: CCDS48 LELLASSCPPASVSQRAGITAAINLAKLKLFRHYYVLIVCYIYFTRIIAFLLKLAVPFQW 470 480 490 500 510 520 480 490 500 510 520 530 pF1KE9 QWLYQLLVEGSTLAFFVLTGYKFQPTGNNPYLQLPQEDEEDVQMEQVMTDSGFREGLSKV .:::::: : .::.:::::::::.:...:::::: :: :::..::.:.: :: : CCDS48 KWLYQLLDETATLVFFVLTGYKFRPASDNPYLQLSQE-EEDLEMESVVTTSGVMESMKKV 530 540 550 560 570 580 540 pF1KE9 NKTASGRELL CCDS48 KKVTNGSVEPQGEWEGAV 590 600 543 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 02:38:08 2016 done: Tue Nov 8 02:38:08 2016 Total Scan time: 3.480 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]