FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9536, 1215 aa 1>>>pF1KE9536 1215 - 1215 aa - 1215 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.5768+/-0.00108; mu= 12.3174+/- 0.065 mean_var=130.1963+/-25.337, 0's: 0 Z-trim(107.7): 42 B-trim: 49 in 1/51 Lambda= 0.112402 statistics sampled from 9700 (9722) to 9700 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.656), E-opt: 0.2 (0.299), width: 16 Scan time: 3.310 The best scores are: opt bits E(32554) CCDS31166.1 GPR158 gene_id:57512|Hs108|chr10 (1215) 8144 1333.0 0 CCDS42308.1 GPR179 gene_id:440435|Hs108|chr17 (2367) 2035 342.5 7.4e-93 >>CCDS31166.1 GPR158 gene_id:57512|Hs108|chr10 (1215 aa) initn: 8144 init1: 8144 opt: 8144 Z-score: 7138.8 bits: 1333.0 E(32554): 0 Smith-Waterman score: 8144; 99.9% identity (100.0% similar) in 1215 aa overlap (1-1215:1-1215) 10 20 30 40 50 60 pF1KE9 MGAMAYPLLLCLLLAQLGLGAVGASRDPQGRPDSPRERTPKGKPHAQQPGRASASDSSAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MGAMAYPLLLCLLLAQLGLGAVGASRDPQGRPDSPRERTPKGKPHAQQPGRASASDSSAP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 WSRSTDGTILAQKLAEEVPMDVASYLYTGDSHQLKRANCSGRYELAGLPGKWPALASAHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 WSRSTDGTILAQKLAEEVPMDVASYLYTGDSHQLKRANCSGRYELAGLPGKWPALASAHP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 SLHRALDTLTHATNFLNVMLQSNKSREQNLQDDLDWYQALVWSLLEGEPSISRAAITFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SLHRALDTLTHATNFLNVMLQSNKSREQNLQDDLDWYQALVWSLLEGEPSISRAAITFST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 DSLSAPAPQVFLQATREESRILLQDLSSSAPHLANATLETEWFHGLRRKWRPHLHRRGPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DSLSAPAPQVFLQATREESRILLQDLSSSAPHLANATLETEWFHGLRRKWRPHLHRRGPN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 QGPRGLGHSWRRKDGLGGDKSHFKWSPPYLECENGSYKPGWLVTLSSAIYGLQPNLVPEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QGPRGLGHSWRRKDGLGGDKSHFKWSPPYLECENGSYKPGWLVTLSSAIYGLQPNLVPEF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 RGVMKVDINLQKVDIDQCSSDGWFSGTHKCHLNNSECMPIKGLGFVLGAYECICKAGFYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RGVMKVDINLQKVDIDQCSSDGWFSGTHKCHLNNSECMPIKGLGFVLGAYECICKAGFYH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 PGVLPVNNFRRRGPDQHISGSTKDVSEEAYVCLPCREGCPFCADDSPCFVQEDKYLRLAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PGVLPVNNFRRRGPDQHISGSTKDVSEEAYVCLPCREGCPFCADDSPCFVQEDKYLRLAI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 ISFQGLCMLLDFVSMLVVYHFRKAKSIRASGLILLETILFGSLLLYFPVVILYFEPSTFR ::::.::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ISFQALCMLLDFVSMLVVYHFRKAKSIRASGLILLETILFGSLLLYFPVVILYFEPSTFR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 CILLRWARLLGFATVYGTVTLKLHRVLKVFLSRTAQRIPYMTGGRVMRMLAVILLVVFWF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CILLRWARLLGFATVYGTVTLKLHRVLKVFLSRTAQRIPYMTGGRVMRMLAVILLVVFWF 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 LIGWTSSVCQNLEKQISLIGQGKTSDHLIFNMCLIDRWDYMTAVAEFLFLLWGVYLCYAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LIGWTSSVCQNLEKQISLIGQGKTSDHLIFNMCLIDRWDYMTAVAEFLFLLWGVYLCYAV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 RTVPSAFHEPRYMAVAVHNELIISAIFHTIRFVLASRLQSDWMLMLYFAHTHLTVTVTIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RTVPSAFHEPRYMAVAVHNELIISAIFHTIRFVLASRLQSDWMLMLYFAHTHLTVTVTIG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 LLLIPKFSHSSNNPRDDIATEAYEDELDMGRSGSYLNSSINSAWSEHSLDPEDIRDELKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LLLIPKFSHSSNNPRDDIATEAYEDELDMGRSGSYLNSSINSAWSEHSLDPEDIRDELKK 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 LYAQLEIYKRKKMITNNPHLQKKRCSKKGLGRSIMRRITEIPETVSRQCSKEDKEGADHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LYAQLEIYKRKKMITNNPHLQKKRCSKKGLGRSIMRRITEIPETVSRQCSKEDKEGADHG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 TAKGTALIRKNPPESSGNTGKSKEETLKNRVFSLKKSHSTYDHVRDQTEESSSLPTESQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TAKGTALIRKNPPESSGNTGKSKEETLKNRVFSLKKSHSTYDHVRDQTEESSSLPTESQE 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 EETTENSTLESLSGKKLTQKLKEDSEAESTESVPLVCKSASAHNLSSEKKTGHPRTSMLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EETTENSTLESLSGKKLTQKLKEDSEAESTESVPLVCKSASAHNLSSEKKTGHPRTSMLQ 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 KSLSVIASAKEKTLGLAGKTQTAGVEERTKSQKPLPKDKETNRNHSNSDNTETKDPAPQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KSLSVIASAKEKTLGLAGKTQTAGVEERTKSQKPLPKDKETNRNHSNSDNTETKDPAPQN 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 SNPAEEPRKPQKSGIMKQQRVNPTTANSDLNPGTTQMKDNFDIGEVCPWEVYDLTPGPVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SNPAEEPRKPQKSGIMKQQRVNPTTANSDLNPGTTQMKDNFDIGEVCPWEVYDLTPGPVP 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 SESKVQKHVSIVASEMEKNPTFSLKEKSHHKPKAAEVCQQSNQKRIDKAEVCLWESQGQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SESKVQKHVSIVASEMEKNPTFSLKEKSHHKPKAAEVCQQSNQKRIDKAEVCLWESQGQS 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 ILEDEKLLISKTPVLPERAKEENGGQPRAANVCAGQSEELPPKAVASKTENENLNQIGHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 ILEDEKLLISKTPVLPERAKEENGGQPRAANVCAGQSEELPPKAVASKTENENLNQIGHQ 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 EKKTSSSEENVRGSYNSSNNFQQPLTSRAEVCPWEFETPAQPNAGRSVALPASSALSANK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EKKTSSSEENVRGSYNSSNNFQQPLTSRAEVCPWEFETPAQPNAGRSVALPASSALSANK 1150 1160 1170 1180 1190 1200 1210 pF1KE9 IAGPRKEEIWDSFKV ::::::::::::::: CCDS31 IAGPRKEEIWDSFKV 1210 >>CCDS42308.1 GPR179 gene_id:440435|Hs108|chr17 (2367 aa) initn: 2134 init1: 1626 opt: 2035 Z-score: 1780.5 bits: 342.5 E(32554): 7.4e-93 Smith-Waterman score: 2451; 39.4% identity (64.3% similar) in 1157 aa overlap (77-1196:50-1144) 50 60 70 80 90 100 pF1KE9 QQPGRASASDSSAPWSRSTDGTILAQKLAEEVPMDVA----SYLYTGDSHQLKRANCSGR .::.. : .:::.::..::...::: : CCDS42 FVCAWALGGPRPIRSLPPLSSQVKPGSVPMQVPLEGAEAALAYLYSGDAQQLSQVNCSER 20 30 40 50 60 70 110 120 130 140 150 160 pF1KE9 YELAGLPGKWPALASAHPSLHRALDTLTHATNFLNVMLQSNKSREQNLQDDLDWYQALVW :: : : :.: :::. : ::..:.::::..::.: ::.....:..:::::: CCDS42 YEARG-AGAMPGLP---PSLQGAAGTLAQAANFLNMLLQANDIRESSVEEDVEWYQALVR 80 90 100 110 120 130 170 180 190 200 210 220 pF1KE9 SLLEGEPSISRAAITFSTDSLSAPAPQVFLQATREESRILLQDLSSSAPHLANATLETEW :. ::.: . :: .::. .: :. ::::: . .:::::.. . : . . CCDS42 SVAEGDPRVYRALLTFNPPP-GASHLQLALQATRTGEETILQDLSGNWVQEENPPGDLD- 140 150 160 170 180 190 230 240 250 260 270 280 pF1KE9 FHGLRRKWRPHLHRRGPNQGPRGLGH-SWRRKDGLGGDKSHFKWSPPYLECENGSYKPGW : :..: .. .:: .: . :: :: .. . :::.:::..: .::: CCDS42 --------TPALKKRVLTNDLGSLGSPKWPQADGYVGDTQQVRLSPPFLECQEGRLRPGW 200 210 220 230 240 290 300 310 320 330 340 pF1KE9 LVTLSSAIYGLQPNLVPEFRGVMKVDINLQKVDIDQCSSD-GWFSGTHKCHLNNSECMPI :.:::...:::.:.: :: :: ...:..::.:::.::.: ::.:.:: : ::...:.:. CCDS42 LITLSATFYGLKPDLSPEVRGQVQMDVDLQSVDINQCASGPGWYSNTHLCDLNSTQCVPL 250 260 270 280 290 300 350 360 370 380 390 pF1KE9 KGLGFVLGAYECICKAGFY--HP-GVLPVNNFRRRGPDQHISGSTKDVSEEAYVCLPCRE .. ::::: : : :. ::: : : : ..:. : : : . : . :::: : CCDS42 ESQGFVLGRYLCRCRPGFYGASPSGGLEESDFQTTG--QF--GFPEGRSGRLLQCLPCPE 310 320 330 340 350 360 400 410 420 430 440 450 pF1KE9 GCPFCADDSPCFVQEDKYLRLAIISFQGLCMLLDFVSMLVVYHFRKAKSIRASGLILLET :: : : .::.:.: :: :... :. ::: :.:::: :. :. : : :::..:::: CCDS42 GCTSCMDATPCLVEEAAVLRAAVLACQACCMLAIFLSMLVSYRCRRNKRIWASGVVLLET 370 380 390 400 410 420 460 470 480 490 500 510 pF1KE9 ILFGSLLLYFPVVILYFEPSTFRCILLRWARLLGFATVYGTVTLKLHRVLKVFLSRTAQR .::: ::::::: ::::.::.:::: :::.:::::: ::::. :::.:::..:::::::: CCDS42 VLFGFLLLYFPVFILYFKPSVFRCIALRWVRLLGFAIVYGTIILKLYRVLQLFLSRTAQR 430 440 450 460 470 480 520 530 540 550 560 570 pF1KE9 IPYMTGGRVMRMLAVILLVVFWFLIGWTSSVCQNLEKQISLIGQGKTSDHLIFNMCLIDR ...::..: :...:: :. :: :: .. . .. :. .:.: . : .: :: CCDS42 SALLSSGRLLRHLGLLLLPVLGFLAVWTVGALERGIQHAPLVIRGHTPSGRHFYLCHHDR 490 500 510 520 530 540 580 590 600 610 620 630 pF1KE9 WDYMTAVAEFLFLLWGVYLCYAVRTVPSAFHEPRYMAVAVHNELIISAIFHTIRFVLASR :::. .:::.:.: :: .::::.:.: :::::::::..:.::::..:: ::: ::::. CCDS42 WDYIMVVAELLLLCWGSFLCYATRAVLSAFHEPRYMGIALHNELLLSAAFHTARFVLVPS 550 560 570 580 590 600 640 650 660 670 680 690 pF1KE9 LQSDWMLMLYFAHTHLTVTVTIGLLLIPKFSHSSNNPRDDIATEAYEDELDMGRSGSYLN :. :: :.:.: ::: :::.:..:..:::: . . ::.... :. :::::. .:::::. CCDS42 LHPDWTLLLFFFHTHSTVTTTLALIFIPKFWKLGAPPREEMVDEVCEDELDLQHSGSYLG 610 620 630 640 650 660 700 710 720 730 740 750 pF1KE9 SSINSAWSEHSLDPEDIRDELKKLYAQLEIYKRKKMITNNPHLQKKRCSK-KGLGRSIMR ::: :::::::::: ::::::::::::::..: :.: .::::: ::: :. .:::::.:: CCDS42 SSIASAWSEHSLDPGDIRDELKKLYAQLEVHKTKEMAANNPHLPKKRGSSCQGLGRSFMR 670 680 690 700 710 720 760 770 780 790 800 810 pF1KE9 RITEIPETVSRQCSKEDKEGADHGTAKGTALIRKNPPESSGNTGKSKEETLKNRVFSLKK ..:.::...:: :. :. . ::. :.. :. :: . .. .:.: CCDS42 YLAEFPEALARQHSR-DSGSPGHGSLPGSS--RRRLLSSSLQEPEGTP--------ALHK 730 740 750 760 770 820 830 840 850 860 870 pF1KE9 SHSTYDHVRDQTEESSSLPTESQEEETTENSTLESLSGKKLTQKLKEDSEAESTESVP-L :.::::. :.: . :.:: .::..: .. ::.:. : : CCDS42 SRSTYDQRREQ-----------------DPPLLDSLLRRKLAKKASRTESRESVEGPPAL 780 790 800 810 880 890 900 910 920 pF1KE9 VCKSASAHNLSSEKKTGHPRTSMLQKSLSVIASAKEKTLGLAGKT-------QTAGVEER .:::::::. .. . : . ::::::: ::..::.: .:... :. ::: CCDS42 GFRSASAHNLTVGERLPRARPASLQKSLSV-ASSREKALLMASQAYLEETYRQAKEREER 820 830 840 850 860 870 930 940 950 960 970 pF1KE9 TKSQKPLP---KDKETNRNHSNSDNTETKDPAPQNSNPA----------EEPRKPQKSGI :.. . . . : . . :.: .:. . :: :. CCDS42 KKAKAAMASLVRRPSARRLERPRGAPLSAPPSPAKSSSVDSSHTSGRLHEEARRRLPHPP 880 890 900 910 920 930 980 990 1000 1010 1020 1030 pF1KE9 MKQQRVNPTTANSDLNPGTTQMKDNFDIGEVCPWEVYDLTPGPVPSESKV--QKHVSIVA ...: .: : :. : . . . . : . :.: :.:. . : . . . CCDS42 IRHQVSTPILA---LSGGLGEPRMLSPTSTLAPALLPALAPTPAPALAPVPVSPQSPNLL 940 950 960 970 980 1040 1050 1060 1070 1080 1090 pF1KE9 SEMEKNPTFSLKEKSHHKPKAAEVCQQSNQKRIDKAEVCLWESQGQSILEDEKLLISKTP . . . : :... :. . . ... :.. ::.. . . . :. CCDS42 TYICPWENAELPAKQENVPQEGPSGPERGHHSPAPARARLWRALS--------VAVEKSR 990 1000 1010 1020 1030 1040 1100 1110 1120 1130 1140 1150 pF1KE9 VLPERAKEENGGQPRAANVCAGQSEELPPKAVASKT--ENENLNQIGHQEKKTSSSEENV . .. :.. . : :: . .. ::. . :. .. .. ..: : . : CCDS42 AGENEMDAEDAHHQREANDVDEDRPKIFPKSHSLKAPVQQGSMRSLGLAIKALTRS---- 1050 1060 1070 1080 1090 1160 1170 1180 1190 1200 pF1KE9 RGSYNSSNNFQQ-PLTSRAEVCPWEFETPAQ-PNAGRSVALPASSALSANKIAGPRKEEI :..: ... .. : . . . . .:.. : :: :. ..:: CCDS42 RSTYREKESVEESPEGQNSGTAGESMGAPSRSPRLGRPKAVSKQAALIPSDDKESLQNQQ 1100 1110 1120 1130 1140 1150 1210 pF1KE9 WDSFKV CCDS42 NAHTSRMLQVCQREGSREQEDRGRRMTQGLGERKAERAGKTGLAMLRQVSRDKNIKQSKE 1160 1170 1180 1190 1200 1210 1215 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:45:38 2016 done: Mon Nov 7 18:45:38 2016 Total Scan time: 3.310 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]