FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9428, 399 aa 1>>>pF1KE9428 399 - 399 aa - 399 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.7079+/-0.000855; mu= 11.9106+/- 0.052 mean_var=113.5828+/-23.063, 0's: 0 Z-trim(110.7): 13 B-trim: 0 in 0/50 Lambda= 0.120342 statistics sampled from 11806 (11817) to 11806 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.71), E-opt: 0.2 (0.363), width: 16 Scan time: 2.980 The best scores are: opt bits E(32554) CCDS1609.1 GPR137B gene_id:7107|Hs108|chr1 ( 399) 2706 480.3 1.3e-135 CCDS53655.1 GPR137 gene_id:56834|Hs108|chr11 ( 475) 1226 223.4 3.4e-58 CCDS53656.1 GPR137 gene_id:56834|Hs108|chr11 ( 396) 1220 222.3 6e-58 CCDS8066.1 GPR137 gene_id:56834|Hs108|chr11 ( 417) 1220 222.4 6.3e-58 CCDS53657.1 GPR137 gene_id:56834|Hs108|chr11 ( 320) 1166 212.9 3.4e-55 CCDS45106.1 GPR137C gene_id:283554|Hs108|chr14 ( 429) 1062 194.9 1.2e-49 CCDS53658.1 GPR137 gene_id:56834|Hs108|chr11 ( 346) 754 141.4 1.2e-33 >>CCDS1609.1 GPR137B gene_id:7107|Hs108|chr1 (399 aa) initn: 2706 init1: 2706 opt: 2706 Z-score: 2548.1 bits: 480.3 E(32554): 1.3e-135 Smith-Waterman score: 2706; 100.0% identity (100.0% similar) in 399 aa overlap (1-399:1-399) 10 20 30 40 50 60 pF1KE9 MRPERPRPRGSAPGPMETPPWDPARNDSLPPTLTPAVPPYVKLGLTVVYTVFYALLFVFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS16 MRPERPRPRGSAPGPMETPPWDPARNDSLPPTLTPAVPPYVKLGLTVVYTVFYALLFVFI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 YVQLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSLSPFVFWLLYCF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS16 YVQLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSLSPFVFWLLYCF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 PVCLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASLFISLVFLLVNLTCAVLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS16 PVCLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASLFISLVFLLVNLTCAVLV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 KTGNWERKVIVSVRVAINDTLFVLCAVSLSICLYKISKMSLANIYLESKGSSVCQVTAIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS16 KTGNWERKVIVSVRVAINDTLFVLCAVSLSICLYKISKMSLANIYLESKGSSVCQVTAIG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 VTVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQADLKNQLGDAGYVLFGVVLFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS16 VTVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQADLKNQLGDAGYVLFGVVLFV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 WELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFFDNPRRYDSDDDLAWNIAPQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS16 WELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFFDNPRRYDSDDDLAWNIAPQG 310 320 330 340 350 360 370 380 390 pF1KE9 LQGGFAPDYYDWGQQTNSFLAQAGTLQDSTLDPDKPSLG ::::::::::::::::::::::::::::::::::::::: CCDS16 LQGGFAPDYYDWGQQTNSFLAQAGTLQDSTLDPDKPSLG 370 380 390 >>CCDS53655.1 GPR137 gene_id:56834|Hs108|chr11 (475 aa) initn: 1215 init1: 729 opt: 1226 Z-score: 1158.3 bits: 223.4 E(32554): 3.4e-58 Smith-Waterman score: 1226; 54.4% identity (76.6% similar) in 355 aa overlap (4-354:41-393) 10 20 30 pF1KE9 MRPERPRPRGSAPGPMETPPWDPARNDS-LPPT .:: : : . : : : : : :. CCDS53 VVKAQLGPTVALEGRAPRAPGPSCLGNGNCQRPGPITSRNVTRASLP-DMESNLSGLVPA 20 30 40 50 60 40 50 60 70 80 90 pF1KE9 --LTPAVPPYVKLGLTVVYTVFYALLFVFIYVQLWLVLRYRHKRLSYQSVFLFLCLFWAS :.::.:: : ::::..::..::::: .:.:::::: : :::::::.::: :::.::. CCDS53 AGLVPALPPAVTLGLTAAYTTLYALLFFSVYAQLWLVLLYGHKRLSYQTVFLALCLLWAA 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE9 LRTVLFSFYFKDFVAANSLSPFVFWLLYCFPVCLQFFTLTLMNLYFTQVIFKAKSKYSPE :::.::::::.: :: :.:. :::::: ::::::::::::::::.::.:::: : :: CCDS53 LRTTLFSFYFRDTPRANRLGPLPFWLLYCCPVCLQFFTLTLMNLYFAQVVFKAKVKRRPE 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE9 LLKYRLPLYLASLFISLVFLLVNLTCAVLVKTGNWERKVIVSVRVAINDTLFVLCAVSLS . . : . : . ::.:::::. :::: . . ... ::: ..:.:::.::.::. CCDS53 MSRGLLAVRGAFVGASLLFLLVNVLCAVLSHRRRAQPWALLLVRVLVSDSLFVICALSLA 190 200 210 220 230 240 220 230 240 250 260 pF1KE9 ICLYKISKMSLA-NIYLESKGSSVCQVTAIGVTVILLYTSRACYNLFILSFSQNKSVHSF :: ... . . .::::.::.::::..:.: ...:::.::::::: :... .. . .: CCDS53 ACLCLVARRAPSTSIYLEAKGTSVCQAAAMGGAMVLLYASRACYNLTALALAPQSRLDTF 250 260 270 280 290 300 270 280 290 300 310 320 pF1KE9 DYDWYNVSDQADLKNQLGDAGYVLFGVVLFVWELLPTTLVVYFFRVRNPTKDLTNPGMVP ::::::::::::: :.::. ::..::..:::::::::::.: ::::. : .::.. .. CCDS53 DYDWYNVSDQADLVNDLGNKGYLVFGLILFVWELLPTTLLVGFFRVHRPPQDLSTSHILN 310 320 330 340 350 360 330 340 350 360 370 380 pF1KE9 SHGFSPRSYFFDNPRRYDSDDDLAWNIAPQGLQGGFAPDYYDWGQQTNSFLAQAGTLQDS .. :. :::::: . . :. .: CCDS53 GQVFASRSYFFDRAGHCE-DEGCSWEHSRGESTRCQDQAATTTVSTPPHRRDPPPSPTEY 370 380 390 400 410 420 >>CCDS53656.1 GPR137 gene_id:56834|Hs108|chr11 (396 aa) initn: 1215 init1: 729 opt: 1220 Z-score: 1153.8 bits: 222.3 E(32554): 6e-58 Smith-Waterman score: 1220; 56.7% identity (80.2% similar) in 323 aa overlap (33-354:14-335) 10 20 30 40 50 60 pF1KE9 PERPRPRGSAPGPMETPPWDPARNDSLPPTLTPAVPPYVKLGLTVVYTVFYALLFVFIYV :.::.:: : ::::..::..::::: .:. CCDS53 MESNLSGLVPAAGLVPALPPAVTLGLTAAYTTLYALLFFSVYA 10 20 30 40 70 80 90 100 110 120 pF1KE9 QLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSLSPFVFWLLYCFPV :::::: : :::::::.::: :::.::.:::.::::::.: :: :.:. :::::: :: CCDS53 QLWLVLLYGHKRLSYQTVFLALCLLWAALRTTLFSFYFRDTPRANRLGPLPFWLLYCCPV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE9 CLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASLFISLVFLLVNLTCAVLVKT ::::::::::::::.::.:::: : ::. . : . : . ::.:::::. :::: . CCDS53 CLQFFTLTLMNLYFAQVVFKAKVKRRPEMSRGLLAVRGAFVGASLLFLLVNVLCAVLSHR 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE9 GNWERKVIVSVRVAINDTLFVLCAVSLSICLYKISKMSLA-NIYLESKGSSVCQVTAIGV . ... ::: ..:.:::.::.::. :: ... . . .::::.::.::::..:.: CCDS53 RRAQPWALLLVRVLVSDSLFVICALSLAACLCLVARRAPSTSIYLEAKGTSVCQAAAMGG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE9 TVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQADLKNQLGDAGYVLFGVVLFVW ...:::.::::::: :... .. . .:::::::::::::: :.::. ::..::..:::: CCDS53 AMVLLYASRACYNLTALALAPQSRLDTFDYDWYNVSDQADLVNDLGNKGYLVFGLILFVW 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE9 ELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFFDNPRRYDSDDDLAWNIAPQGL :::::::.: ::::. : .::.. .. .. :. :::::: . . :. .: CCDS53 ELLPTTLLVGFFRVHRPPQDLSTSHILNGQVFASRSYFFDRAGHCE-DEGCSWEHSRGES 290 300 310 320 330 340 370 380 390 pF1KE9 QGGFAPDYYDWGQQTNSFLAQAGTLQDSTLDPDKPSLG CCDS53 TSMSGSLGSGSWYGAIGREPGWYGGSQTKTTPLLFSQVPGPGGHHHSLYSTPQT 350 360 370 380 390 >>CCDS8066.1 GPR137 gene_id:56834|Hs108|chr11 (417 aa) initn: 1215 init1: 729 opt: 1220 Z-score: 1153.5 bits: 222.4 E(32554): 6.3e-58 Smith-Waterman score: 1220; 56.7% identity (80.2% similar) in 323 aa overlap (33-354:14-335) 10 20 30 40 50 60 pF1KE9 PERPRPRGSAPGPMETPPWDPARNDSLPPTLTPAVPPYVKLGLTVVYTVFYALLFVFIYV :.::.:: : ::::..::..::::: .:. CCDS80 MESNLSGLVPAAGLVPALPPAVTLGLTAAYTTLYALLFFSVYA 10 20 30 40 70 80 90 100 110 120 pF1KE9 QLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSLSPFVFWLLYCFPV :::::: : :::::::.::: :::.::.:::.::::::.: :: :.:. :::::: :: CCDS80 QLWLVLLYGHKRLSYQTVFLALCLLWAALRTTLFSFYFRDTPRANRLGPLPFWLLYCCPV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE9 CLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASLFISLVFLLVNLTCAVLVKT ::::::::::::::.::.:::: : ::. . : . : . ::.:::::. :::: . CCDS80 CLQFFTLTLMNLYFAQVVFKAKVKRRPEMSRGLLAVRGAFVGASLLFLLVNVLCAVLSHR 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE9 GNWERKVIVSVRVAINDTLFVLCAVSLSICLYKISKMSLA-NIYLESKGSSVCQVTAIGV . ... ::: ..:.:::.::.::. :: ... . . .::::.::.::::..:.: CCDS80 RRAQPWALLLVRVLVSDSLFVICALSLAACLCLVARRAPSTSIYLEAKGTSVCQAAAMGG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE9 TVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQADLKNQLGDAGYVLFGVVLFVW ...:::.::::::: :... .. . .:::::::::::::: :.::. ::..::..:::: CCDS80 AMVLLYASRACYNLTALALAPQSRLDTFDYDWYNVSDQADLVNDLGNKGYLVFGLILFVW 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE9 ELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFFDNPRRYDSDDDLAWNIAPQGL :::::::.: ::::. : .::.. .. .. :. :::::: . . :. .: CCDS80 ELLPTTLLVGFFRVHRPPQDLSTSHILNGQVFASRSYFFDRAGHCE-DEGCSWEHSRGES 290 300 310 320 330 340 370 380 390 pF1KE9 QGGFAPDYYDWGQQTNSFLAQAGTLQDSTLDPDKPSLG CCDS80 TRCQDQAATTTVSTPPHRRDPPPSPTEYPGPSPPHPRPLCQVCLPLLAQDPGGRGYPLLW 350 360 370 380 390 400 >>CCDS53657.1 GPR137 gene_id:56834|Hs108|chr11 (320 aa) initn: 1166 init1: 729 opt: 1166 Z-score: 1104.5 bits: 212.9 E(32554): 3.4e-55 Smith-Waterman score: 1166; 59.8% identity (82.1% similar) in 291 aa overlap (33-322:14-304) 10 20 30 40 50 60 pF1KE9 PERPRPRGSAPGPMETPPWDPARNDSLPPTLTPAVPPYVKLGLTVVYTVFYALLFVFIYV :.::.:: : ::::..::..::::: .:. CCDS53 MESNLSGLVPAAGLVPALPPAVTLGLTAAYTTLYALLFFSVYA 10 20 30 40 70 80 90 100 110 120 pF1KE9 QLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSLSPFVFWLLYCFPV :::::: : :::::::.::: :::.::.:::.::::::.: :: :.:. :::::: :: CCDS53 QLWLVLLYGHKRLSYQTVFLALCLLWAALRTTLFSFYFRDTPRANRLGPLPFWLLYCCPV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE9 CLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASLFISLVFLLVNLTCAVLVKT ::::::::::::::.::.:::: : ::. . : . : . ::.:::::. :::: . CCDS53 CLQFFTLTLMNLYFAQVVFKAKVKRRPEMSRGLLAVRGAFVGASLLFLLVNVLCAVLSHR 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE9 GNWERKVIVSVRVAINDTLFVLCAVSLSICLYKISKMSLA-NIYLESKGSSVCQVTAIGV . ... ::: ..:.:::.::.::. :: ... . . .::::.::.::::..:.: CCDS53 RRAQPWALLLVRVLVSDSLFVICALSLAACLCLVARRAPSTSIYLEAKGTSVCQAAAMGG 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE9 TVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQADLKNQLGDAGYVLFGVVLFVW ...:::.::::::: :... .. . .:::::::::::::: :.::. ::..::..:::: CCDS53 AMVLLYASRACYNLTALALAPQSRLDTFDYDWYNVSDQADLVNDLGNKGYLVFGLILFVW 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE9 ELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFFDNPRRYDSDDDLAWNIAPQGL :::::::.: ::::. : .:: CCDS53 ELLPTTLLVGFFRVHRPPQDLYVGQSRLWELVWCHRA 290 300 310 320 >>CCDS45106.1 GPR137C gene_id:283554|Hs108|chr14 (429 aa) initn: 733 init1: 485 opt: 1062 Z-score: 1005.1 bits: 194.9 E(32554): 1.2e-49 Smith-Waterman score: 1068; 48.4% identity (72.5% similar) in 364 aa overlap (9-352:2-361) 10 20 30 40 pF1KE9 MRPERPRPRGSAPGPMETPPWDPARNDSLPPTLT-----------PAVPPYVKLGLTVVY : :.::: . .:. : : . ::: :.:.:.:.. CCDS45 MRVSVPGPAAAAAPAAGREPSTPGGGSGGGGAVAAASGAAVPGSVQLALSVLH 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 TVFYALLFVFIYVQLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSL ...:: ::.: :.::: .: ::..::::::. :::::.::.:::.::: :. . : CCDS45 ALLYAALFAFAYLQLWRLLLYRERRLSYQSLCLFLCLLWAALRTTLFSAAFSLSGSLPLL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 SP------FVFWLLYCFPVCLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASL : : ::::::: :::: :: :.:::...:: :.. . :: .... :.:. . CCDS45 RPPAHLHFFPHWLLYCFPSCLQFSTLCLLNLYLAEVICKVRC--ATELDRHKILLHLGFI 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE9 FISLVFLLVNLTCAVLVKTGNWERKV--IVSVRVAINDTLFVLCAVSLSIC-LYKISKMS . ::.::.::::::.::. : .. : ::. :::.::.:::.:: .: . ::.::: CCDS45 MASLLFLVVNLTCAMLVHGDVPENQLKWTVFVRALINDSLFILCAISL-VCYICKITKMS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE9 LANIYLESKGSSVCQVTAIGVTVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQA ::.:::::: :.::....: .:::::.::::::: ....::. :.: : :.::.: CCDS45 SANVYLESKGMSLCQTVVVGSVVILLYSSRACYNLVVVTISQDTLESPFNYGWDNLSDKA 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE9 DLKNQLGDAGYVLFGVVLFVWELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFF ... :. :..::.:::.:: .:. :: :::.. ...:. ::. ::..: :.::: CCDS45 HVEDISGEE-YIVFGMVLFLWEHVPAWSVVLFFRAQRLNQNLAPAGMINSHSYSSRAYFF 300 310 320 330 340 350 360 370 380 390 pF1KE9 DNPRRYDSDDDLAWNIAPQGLQGGFAPDYYDWGQQTNSFLAQAGTLQDSTLDPDKPSLG :::::::::::: CCDS45 DNPRRYDSDDDLPRLGSSREGSLPNSQSLGWYGTMTGCGSSSYTVTPHLNGPMTDTAPLL 350 360 370 380 390 400 >>CCDS53658.1 GPR137 gene_id:56834|Hs108|chr11 (346 aa) initn: 971 init1: 731 opt: 754 Z-score: 717.4 bits: 141.4 E(32554): 1.2e-33 Smith-Waterman score: 894; 47.7% identity (66.6% similar) in 323 aa overlap (33-354:14-285) 10 20 30 40 50 60 pF1KE9 PERPRPRGSAPGPMETPPWDPARNDSLPPTLTPAVPPYVKLGLTVVYTVFYALLFVFIYV :.::.:: : ::::..::..::::: .:. CCDS53 MESNLSGLVPAAGLVPALPPAVTLGLTAAYTTLYALLFFSVYA 10 20 30 40 70 80 90 100 110 120 pF1KE9 QLWLVLRYRHKRLSYQSVFLFLCLFWASLRTVLFSFYFKDFVAANSLSPFVFWLLYCFPV :::::: : :::::::.::: :::.::.:::.::::::.: :: :.:. :::::: :: CCDS53 QLWLVLLYGHKRLSYQTVFLALCLLWAALRTTLFSFYFRDTPRANRLGPLPFWLLYCCPV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE9 CLQFFTLTLMNLYFTQVIFKAKSKYSPELLKYRLPLYLASLFISLVFLLVNLTCAVLVKT ::::::::::::::.::.:::: : ::. . : . : . ::.:::::. :::: . CCDS53 CLQFFTLTLMNLYFAQVVFKAKVKRRPEMSRGLLAVRGAFVGASLLFLLVNVLCAVLSHR 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE9 GNWERKVIVSVRVAINDTLFVLCAVSLSICLYKISKMSLA-NIYLESKGSSVCQVTAIGV . ... ::: ..:.:::.::.::. :: ... . . .::::.: CCDS53 RRAQPWALLLVRVLVSDSLFVICALSLAACLCLVARRAPSTSIYLEAK------------ 170 180 190 200 210 250 260 270 280 290 300 pF1KE9 TVILLYTSRACYNLFILSFSQNKSVHSFDYDWYNVSDQADLKNQLGDAGYVLFGVVLFVW ::: :.::. ::..::..:::: CCDS53 --------------------------------------ADLVNDLGNKGYLVFGLILFVW 220 230 310 320 330 340 350 360 pF1KE9 ELLPTTLVVYFFRVRNPTKDLTNPGMVPSHGFSPRSYFFDNPRRYDSDDDLAWNIAPQGL :::::::.: ::::. : .::.. .. .. :. :::::: . . :. .: CCDS53 ELLPTTLLVGFFRVHRPPQDLSTSHILNGQVFASRSYFFDRAGHCE-DEGCSWEHSRGES 240 250 260 270 280 290 370 380 390 pF1KE9 QGGFAPDYYDWGQQTNSFLAQAGTLQDSTLDPDKPSLG CCDS53 TSMSGSLGSGSWYGAIGREPGWYGGSQTKTTPLLFSQVPGPGGHHHSLYSTPQT 300 310 320 330 340 399 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:37:44 2016 done: Sun Nov 6 18:37:44 2016 Total Scan time: 2.980 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]