FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9560, 385 aa 1>>>pF1KE9560 385 - 385 aa - 385 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8393+/-0.000833; mu= 14.7015+/- 0.050 mean_var=155.9751+/-49.756, 0's: 0 Z-trim(109.9): 286 B-trim: 1327 in 2/48 Lambda= 0.102694 statistics sampled from 10618 (11192) to 10618 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.702), E-opt: 0.2 (0.344), width: 16 Scan time: 2.760 The best scores are: opt bits E(32554) CCDS12350.1 F2RL3 gene_id:9002|Hs108|chr19 ( 385) 2562 391.8 5.5e-109 CCDS58959.1 F2RL2 gene_id:2151|Hs108|chr5 ( 352) 693 114.8 1.2e-25 CCDS4031.1 F2RL2 gene_id:2151|Hs108|chr5 ( 374) 693 114.9 1.2e-25 CCDS4033.1 F2RL1 gene_id:2150|Hs108|chr5 ( 397) 666 110.9 2e-24 CCDS4032.1 F2R gene_id:2149|Hs108|chr5 ( 425) 615 103.4 4e-22 CCDS14115.1 P2RY8 gene_id:286530|Hs108|chrY ( 359) 587 99.1 6.4e-21 CCDS14115.1 P2RY8 gene_id:286530|Hs108|chrX ( 359) 587 99.1 6.4e-21 CCDS2148.1 GPR17 gene_id:2840|Hs108|chr2 ( 367) 479 83.2 4.3e-16 CCDS33063.1 C5AR1 gene_id:728|Hs108|chr19 ( 350) 477 82.8 5.1e-16 CCDS9412.1 CYSLTR2 gene_id:57105|Hs108|chr13 ( 346) 465 81.1 1.7e-15 CCDS1405.1 GPR25 gene_id:2848|Hs108|chr1 ( 361) 454 79.4 5.5e-15 CCDS14398.1 P2RY4 gene_id:5030|Hs108|chrX ( 365) 437 76.9 3.2e-14 CCDS2409.1 CXCR1 gene_id:3577|Hs108|chr2 ( 350) 436 76.8 3.4e-14 CCDS2684.1 CCR8 gene_id:1237|Hs108|chr3 ( 355) 434 76.5 4.2e-14 CCDS2738.1 CCR3 gene_id:1232|Hs108|chr3 ( 355) 432 76.2 5.2e-14 CCDS54574.1 CCR3 gene_id:1232|Hs108|chr3 ( 376) 432 76.2 5.4e-14 CCDS8220.1 P2RY6 gene_id:5031|Hs108|chr11 ( 328) 431 76.0 5.5e-14 CCDS13944.1 SSTR3 gene_id:6753|Hs108|chr22 ( 418) 425 75.2 1.2e-13 CCDS11739.1 GALR2 gene_id:8811|Hs108|chr17 ( 387) 422 74.7 1.5e-13 CCDS42856.1 SSTR4 gene_id:6754|Hs108|chr20 ( 388) 421 74.6 1.7e-13 CCDS12669.1 GPR4 gene_id:2828|Hs108|chr19 ( 362) 420 74.4 1.8e-13 CCDS9482.1 OXGR1 gene_id:27199|Hs108|chr13 ( 337) 418 74.1 2.1e-13 CCDS2408.1 CXCR2 gene_id:3579|Hs108|chr2 ( 360) 418 74.1 2.2e-13 CCDS8553.1 LPAR5 gene_id:57121|Hs108|chr12 ( 372) 418 74.1 2.3e-13 CCDS9625.2 LTB4R2 gene_id:56413|Hs108|chr14 ( 358) 417 74.0 2.4e-13 CCDS2733.1 CCR9 gene_id:10803|Hs108|chr3 ( 357) 416 73.8 2.7e-13 CCDS2732.1 CCR9 gene_id:10803|Hs108|chr3 ( 369) 416 73.8 2.8e-13 CCDS2737.1 CCR1 gene_id:1230|Hs108|chr3 ( 355) 404 72.0 9.2e-13 CCDS2739.1 CCR5 gene_id:1234|Hs108|chr3 ( 352) 401 71.6 1.2e-12 CCDS9410.1 LPAR6 gene_id:10161|Hs108|chr13 ( 344) 400 71.4 1.4e-12 CCDS9894.2 GPR68 gene_id:8111|Hs108|chr14 ( 365) 400 71.5 1.4e-12 CCDS12459.1 FFAR3 gene_id:2865|Hs108|chr19 ( 346) 399 71.3 1.5e-12 CCDS10429.1 SSTR5 gene_id:6755|Hs108|chr16 ( 364) 395 70.7 2.4e-12 CCDS2368.1 GPR1 gene_id:2825|Hs108|chr2 ( 355) 393 70.4 2.9e-12 CCDS13556.1 OPRL1 gene_id:4987|Hs108|chr20 ( 370) 392 70.3 3.2e-12 CCDS9236.1 HCAR1 gene_id:27198|Hs108|chr12 ( 346) 390 69.9 3.8e-12 CCDS55069.1 OPRM1 gene_id:4988|Hs108|chr6 ( 389) 389 69.9 4.5e-12 CCDS47508.1 OPRM1 gene_id:4988|Hs108|chr6 ( 392) 389 69.9 4.6e-12 CCDS47505.1 OPRM1 gene_id:4988|Hs108|chr6 ( 397) 389 69.9 4.6e-12 CCDS14439.1 CYSLTR1 gene_id:10800|Hs108|chrX ( 337) 388 69.6 4.6e-12 CCDS55070.1 OPRM1 gene_id:4988|Hs108|chr6 ( 400) 389 69.9 4.6e-12 CCDS47506.1 OPRM1 gene_id:4988|Hs108|chr6 ( 403) 389 69.9 4.6e-12 CCDS47504.1 OPRM1 gene_id:4988|Hs108|chr6 ( 406) 389 69.9 4.7e-12 CCDS43517.1 OPRM1 gene_id:4988|Hs108|chr6 ( 418) 389 69.9 4.7e-12 CCDS47507.1 OPRM1 gene_id:4988|Hs108|chr6 ( 420) 389 69.9 4.8e-12 CCDS43518.1 OPRM1 gene_id:4988|Hs108|chr6 ( 446) 389 69.9 4.9e-12 CCDS9491.1 GPR18 gene_id:2841|Hs108|chr13 ( 331) 387 69.5 5.1e-12 CCDS47503.1 OPRM1 gene_id:4988|Hs108|chr6 ( 493) 389 70.0 5.2e-12 CCDS3137.1 AGTR1 gene_id:185|Hs108|chr3 ( 359) 387 69.5 5.3e-12 CCDS82855.1 AGTR1 gene_id:185|Hs108|chr3 ( 388) 387 69.6 5.6e-12 >>CCDS12350.1 F2RL3 gene_id:9002|Hs108|chr19 (385 aa) initn: 2562 init1: 2562 opt: 2562 Z-score: 2070.1 bits: 391.8 E(32554): 5.5e-109 Smith-Waterman score: 2562; 99.7% identity (100.0% similar) in 385 aa overlap (1-385:1-385) 10 20 30 40 50 60 pF1KE9 MWGRLLLWPLVLGFSLSGGTQTPSVYDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MWGRLLLWPLVLGFSLSGGTQTPSVYDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 LELPDSSRALLLGWVPTRLVPALYGLVLVVGLPANGLALWVLATQAPRLPSTMLLMNLAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS12 LELPDSSRALLLGWVPTRLVPALYGLVLVVGLPANGLALWVLATQAPRLPSTMLLMNLAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 ADLLLALALPPRIAYHLRGQRWPFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ADLLLALALPPRIAYHLRGQRWPFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 PLRARALRGRRLALGLCMAAWLMAAALALPLTLQRQTFRLARSDRVLCHDALPLDAQASH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PLRARALRGRRLALGLCMAAWLMAAALALPLTLQRQTFRLARSDRVLCHDALPLDAQASH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 WQPAFTCLALLGCFLPLLAMLLCYGATLHTLAASGRRYGHALRLTAVVLASAVAFFVPSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WQPAFTCLALLGCFLPLLAMLLCYGATLHTLAASGRRYGHALRLTAVVLASAVAFFVPSN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 LLLLLHYSDPSPSAWGNLYGAYVPSLALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LLLLLHYSDPSPSAWGNLYGAYVPSLALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSP 310 320 330 340 350 360 370 380 pF1KE9 GDTVASKASAEGGSRGMGTHSSLLQ ::::::::::::::::::::::::: CCDS12 GDTVASKASAEGGSRGMGTHSSLLQ 370 380 >>CCDS58959.1 F2RL2 gene_id:2151|Hs108|chr5 (352 aa) initn: 676 init1: 467 opt: 693 Z-score: 574.0 bits: 114.8 E(32554): 1.2e-25 Smith-Waterman score: 693; 36.9% identity (69.6% similar) in 293 aa overlap (54-344:48-340) 30 40 50 60 70 80 pF1KE9 SVYDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDT-LELPDSSRALLLGWVPTRLVPA : ..: . :.. ... . : . . :.:.:: CCDS58 FRGAPPNSFEEFPFSALEGWTGATITVKIKCPEESASHLHVKNATMGYLTSSLSTKLIPA 20 30 40 50 60 70 90 100 110 120 130 140 pF1KE9 LYGLVLVVGLPANGLALWVLATQAPRLPSTMLLMNLATADLLLALALPPRIAYHLRGQRW .: ::.:::.:::...::.: .. . .:.. ::: ::.:. ..:: .::::: :. : CCDS58 IYLLVFVVGVPANAVTLWMLFFRTRSICTTVFYTNLAIADFLFCVTLPFKIAYHLNGNNW 80 90 100 110 120 130 150 160 170 180 190 200 pF1KE9 PFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVHPLRARALRGRRLALGLCMAAWL :::. :: .:. .::.:: :.:::: .:..::::.:::. :.: . :: : .: CCDS58 VFGEVLCRATTVIFYGNMYCSILLLACISINRYLAIVHPFTYRGLPKHTYALVTCGLVWA 140 150 160 170 180 190 210 220 230 240 250 260 pF1KE9 MAAALALPLTLQRQTFRLARSDRVLCHDALPLDAQASHWQ-PAFTCLALLGCFLPLLAML . ::. . .: . :.. : . :::. ..: .: : ::..: ..:.. .. CCDS58 TVFLYMLPFFILKQEYYLVQPDITTCHDVHNTCESSSPFQLYYFISLAFFGFLIPFVLII 200 210 220 230 240 250 270 280 290 300 310 320 pF1KE9 LCYGATLHTLAASGRRYGHALRLTAVVLASAVAFFVPSNLLLLLHYSDPSPSAWGNLYGA ::.: ..:: : .:. .. . ..:. . :.:::..:..:... . .:: CCDS58 YCYAAIIRTLNAYDHRWLWYVKASLLILVIFTICFAPSNIILIIHHANYYYNNTDGLYFI 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE9 YVPSLALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSPGDTVASKASAEGGSRGMGTHS :. .: :..::::.:::.:. .: CCDS58 YLIALCLGSLNSCLDPFLYFLMSKTRNHSTAYLTK 320 330 340 350 >>CCDS4031.1 F2RL2 gene_id:2151|Hs108|chr5 (374 aa) initn: 676 init1: 467 opt: 693 Z-score: 573.7 bits: 114.9 E(32554): 1.2e-25 Smith-Waterman score: 693; 36.9% identity (69.6% similar) in 293 aa overlap (54-344:70-362) 30 40 50 60 70 80 pF1KE9 SVYDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDT-LELPDSSRALLLGWVPTRLVPA : ..: . :.. ... . : . . :.:.:: CCDS40 FRGAPPNSFEEFPFSALEGWTGATITVKIKCPEESASHLHVKNATMGYLTSSLSTKLIPA 40 50 60 70 80 90 90 100 110 120 130 140 pF1KE9 LYGLVLVVGLPANGLALWVLATQAPRLPSTMLLMNLATADLLLALALPPRIAYHLRGQRW .: ::.:::.:::...::.: .. . .:.. ::: ::.:. ..:: .::::: :. : CCDS40 IYLLVFVVGVPANAVTLWMLFFRTRSICTTVFYTNLAIADFLFCVTLPFKIAYHLNGNNW 100 110 120 130 140 150 150 160 170 180 190 200 pF1KE9 PFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVHPLRARALRGRRLALGLCMAAWL :::. :: .:. .::.:: :.:::: .:..::::.:::. :.: . :: : .: CCDS40 VFGEVLCRATTVIFYGNMYCSILLLACISINRYLAIVHPFTYRGLPKHTYALVTCGLVWA 160 170 180 190 200 210 210 220 230 240 250 260 pF1KE9 MAAALALPLTLQRQTFRLARSDRVLCHDALPLDAQASHWQ-PAFTCLALLGCFLPLLAML . ::. . .: . :.. : . :::. ..: .: : ::..: ..:.. .. CCDS40 TVFLYMLPFFILKQEYYLVQPDITTCHDVHNTCESSSPFQLYYFISLAFFGFLIPFVLII 220 230 240 250 260 270 270 280 290 300 310 320 pF1KE9 LCYGATLHTLAASGRRYGHALRLTAVVLASAVAFFVPSNLLLLLHYSDPSPSAWGNLYGA ::.: ..:: : .:. .. . ..:. . :.:::..:..:... . .:: CCDS40 YCYAAIIRTLNAYDHRWLWYVKASLLILVIFTICFAPSNIILIIHHANYYYNNTDGLYFI 280 290 300 310 320 330 330 340 350 360 370 380 pF1KE9 YVPSLALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSPGDTVASKASAEGGSRGMGTHS :. .: :..::::.:::.:. .: CCDS40 YLIALCLGSLNSCLDPFLYFLMSKTRNHSTAYLTK 340 350 360 370 >>CCDS4033.1 F2RL1 gene_id:2150|Hs108|chr5 (397 aa) initn: 462 init1: 252 opt: 666 Z-score: 551.8 bits: 110.9 E(32554): 2e-24 Smith-Waterman score: 666; 33.8% identity (64.8% similar) in 358 aa overlap (10-359:16-363) 10 20 30 40 50 pF1KE9 MWGRLLLWPLVLGFSLSGGTQTPSVYDESGSTGGGDDSTPSILPAPRGYPGQVC :. ..: :: : : ... : : :.: . :. CCDS40 MRSPSAAWLLGAAILLAASLSCSGTIQGTSRSSKGRSLIGKVDGTSHVT-------GKGV 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 ANDSDTLELPDSSRALLLGWVPTRLVPALYGLVLVVGLPANGLALWV-LATQAPRLPSTM . .. .. . . : ..: : . : ..: .: .:.:::::.::.:::: : . :... CCDS40 TVET-VFSVDEFSASVLTGKLTTVFLPIVYTIVFVVGLPSNGMALWVFLFRTKKKHPAVI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 LLMNLATADLLLALALPPRIAYHLRGQRWPFGEAACRLATAALYGHMYGSVLLLAAVSLD . ::: :::: .. .: .::::..:. : .::: : . . .::.:: :.:... .:.. CCDS40 YMANLALADLLSVIWFPLKIAYHIHGNNWIYGEALCNVLIGFFYGNMYCSILFMTCLSVQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 RYLALVHPLRARALRGRRLALGLCMAAWLMAAALALPLTLQRQTFRLARSDRVLCHDALP :: ..:.:. ... . .:.:. .: ::. ...:: . .::. . . . :::.:: CCDS40 RYWVIVNPM-GHSRKKANIAIGISLAIWLLILLVTIPLYVVKQTIFIPALNITTCHDVLP 180 190 200 210 220 230 240 250 260 270 280 pF1KE9 LDAQASHWQPAFTCLALLGCFL-PLLAMLLCYGATLHTLAASG------RRYGHALRLTA . .. : ::. : :: : . : .. : .:. .. .:..: . CCDS40 EQLLVGDMFNYFLSLAI-GVFLFPAFLTASAYVLMIRMLRSSAMDENSEKKRKRAIKLIV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE9 VVLASAVAFFVPSNLLLLLHYSDPSPSAWGNLYGAYVPSLALSTLNSCVDPFIYYYVSAE .::: . :.::::::..:: . .. ...:. :. .: :::::::.:::.::.:: . CCDS40 TVLAMYLICFTPSNLLLVVHYFLIKSQGQSHVYALYIVALCLSTLNSCIDPFVYYFVSHD 300 310 320 330 340 350 350 360 370 380 pF1KE9 FRDKVRAGLFQRSPGDTVASKASAEGGSRGMGTHSSLLQ :::... .:. :: CCDS40 FRDHAKNALLCRSVRTVKQMQVSLTSKKHSRKSSSYSSSSTTVKTSY 360 370 380 390 >>CCDS4032.1 F2R gene_id:2149|Hs108|chr5 (425 aa) initn: 618 init1: 373 opt: 615 Z-score: 510.7 bits: 103.4 E(32554): 4e-22 Smith-Waterman score: 615; 33.6% identity (64.6% similar) in 345 aa overlap (53-384:72-415) 30 40 50 60 70 pF1KE9 PSVYDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDTLE--LP-----DSSRALLLGWV : : :. :. :: :.: : .:. CCDS40 SFLLRNPNDKYEPFWEDEEKNESGLTEYRLVSINKSSPLQKQLPAFISEDASGYLTSSWL 50 60 70 80 90 100 80 90 100 110 120 130 pF1KE9 PTRLVPALYGLVLVVGLPANGLALWVLATQAP-RLPSTMLLMNLATADLLLALALPPRIA : .::..: :.::.:: : .:. :. . . :... ...:::::.:.. .:: .:. CCDS40 -TLFVPSVYTGVFVVSLPLNIMAIVVFILKMKVKKPAVVYMLHLATADVLFVSVLPFKIS 110 120 130 140 150 160 140 150 160 170 180 190 pF1KE9 YHLRGQRWPFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVHPLRARALRGRRLAL :.. :. : :: ::..:::.: .::.:.::....:.::.::.:.:... . : : CCDS40 YYFSGSDWQFGSELCRFVTAAFYCNMYASILLMTVISIDRFLAVVYPMQSLSWRTLGRAS 170 180 190 200 210 220 200 210 220 230 240 250 pF1KE9 GLCMAAWLMAAALALPLTLQRQTFRLARSDRVLCHDALPLDAQASHWQPAFTCLALLGCF :.: : .: : ..:: :..::... . . :::.: ... :. .. . : CCDS40 FTCLAIWALAIAGVVPLLLKEQTIQVPGLNITTCHDVLNETLLEGYYAYYFSAFSAVFFF 230 240 250 260 270 280 260 270 280 290 300 310 pF1KE9 LPLLAMLLCYGATLHTLAASG----RRYGHALRLTAVVLASAVAFFVPSNLLLLLHYSDP .::. .:: . .. :..:. . ..:: :.:.:. . : :.:.::. ::: CCDS40 VPLIISTVCYVSIIRCLSSSAVANRSKKSRALFLSAAVFCIFIICFGPTNVLLIAHYSFL 290 300 310 320 330 340 320 330 340 350 360 pF1KE9 S-PSAWGNLYGAYVPSLALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSPGDTVASKAS : :. : ::. . .:... :.::.::::.:.: . : . : . .: . ..: CCDS40 SHTSTTEAAYFAYLLCVCVSSISCCIDPLIYYYASSECQRYVYSILCCKESSDPSSYNSS 350 360 370 380 390 400 370 380 pF1KE9 AEGGSRGMGTHSSLLQ .. . : : :: : CCDS40 GQLMASKMDTCSSNLNNSIYKKLLT 410 420 >>CCDS14115.1 P2RY8 gene_id:286530|Hs108|chrY (359 aa) initn: 523 init1: 291 opt: 587 Z-score: 489.1 bits: 99.1 E(32554): 6.4e-21 Smith-Waterman score: 587; 34.0% identity (66.3% similar) in 312 aa overlap (80-381:26-335) 50 60 70 80 90 100 pF1KE9 PGQVCANDSDTLELPDSSRALLLGWVPTRLVPALYGLVLVVGLPANGLALWVLATQ-APR .:..:.:: .:..:.: ..:::: . .:: CCDS14 MQVPNSTGPDNATLQMLRNPAIAVALPVVYSLVAAVSIPGNLFSLWVLCRRMGPR 10 20 30 40 50 110 120 130 140 150 160 pF1KE9 LPSTMLLMNLATADLLLALALPPRIAYHLRGQRWPFGEAACRLATAALYGHMYGSVLLLA ::.....::...::.:: .:: .: :: ..: :: : ..:.:.:..::.:.: .. CCDS14 SPSVIFMINLSVTDLMLASVLPFQIYYHCNRHHWVFGVLLCNVVTVAFYANMYSSILTMT 60 70 80 90 100 110 170 180 190 200 210 220 pF1KE9 AVSLDRYLALVHPLRARALRGRRLALGLCMAAWLMAAALALPLTLQRQTFRLARSDRVLC .:..:.:....:: .. : :: :.. : ..::. . ::. :. . . : CCDS14 CISVERFLGVLYPLSSKRWRRRRYAVAACAGTWLLLLTALSPLARTDLTYPVHALGIITC 120 130 140 150 160 170 230 240 250 260 270 280 pF1KE9 HDALP--LDAQASHWQPAFTCLALLGCFLPLLAMLLCYGAT----LHTLAASGR-RYGHA :.: . ... : . . .: ..:.. . :: :: :.: : :: . .: CCDS14 FDVLKWTMLPSVAMWAVFLFTIFILLFLIPFVITVACYTATILKLLRTEEAHGREQRRRA 180 190 200 210 220 230 290 300 310 320 330 340 pF1KE9 LRLTAVVLASAVAFFVPSNLLLLLHYSDPSPSAWG-NLYGAYVPSLALSTLNSCVDPFIY . :.:::: . :. :.:.:..:: : : .: . : .: .: :: ::.:.:::.: CCDS14 VGLAAVVLLAFVTCFAPNNFVLLAHIV--SRLFYGKSYYHVYKLTLCLSCLNNCLDPFVY 240 250 260 270 280 290 350 360 370 380 pF1KE9 YYVSAEFRDKVRAGL-FQRSPGDTVASKASAEGGSRGMGTHSSLLQ :..: ::. ..: : .: : ::. .. . ..: ...: CCDS14 YFASREFQLRLREYLGCRRVPRDTLDTRRESLFSARTTSVRSEAGAHPEGMEGATRPGLQ 300 310 320 330 340 350 CCDS14 RQESVF >>CCDS14115.1 P2RY8 gene_id:286530|Hs108|chrX (359 aa) initn: 523 init1: 291 opt: 587 Z-score: 489.1 bits: 99.1 E(32554): 6.4e-21 Smith-Waterman score: 587; 34.0% identity (66.3% similar) in 312 aa overlap (80-381:26-335) 50 60 70 80 90 100 pF1KE9 PGQVCANDSDTLELPDSSRALLLGWVPTRLVPALYGLVLVVGLPANGLALWVLATQ-APR .:..:.:: .:..:.: ..:::: . .:: CCDS14 MQVPNSTGPDNATLQMLRNPAIAVALPVVYSLVAAVSIPGNLFSLWVLCRRMGPR 10 20 30 40 50 110 120 130 140 150 160 pF1KE9 LPSTMLLMNLATADLLLALALPPRIAYHLRGQRWPFGEAACRLATAALYGHMYGSVLLLA ::.....::...::.:: .:: .: :: ..: :: : ..:.:.:..::.:.: .. CCDS14 SPSVIFMINLSVTDLMLASVLPFQIYYHCNRHHWVFGVLLCNVVTVAFYANMYSSILTMT 60 70 80 90 100 110 170 180 190 200 210 220 pF1KE9 AVSLDRYLALVHPLRARALRGRRLALGLCMAAWLMAAALALPLTLQRQTFRLARSDRVLC .:..:.:....:: .. : :: :.. : ..::. . ::. :. . . : CCDS14 CISVERFLGVLYPLSSKRWRRRRYAVAACAGTWLLLLTALSPLARTDLTYPVHALGIITC 120 130 140 150 160 170 230 240 250 260 270 280 pF1KE9 HDALP--LDAQASHWQPAFTCLALLGCFLPLLAMLLCYGAT----LHTLAASGR-RYGHA :.: . ... : . . .: ..:.. . :: :: :.: : :: . .: CCDS14 FDVLKWTMLPSVAMWAVFLFTIFILLFLIPFVITVACYTATILKLLRTEEAHGREQRRRA 180 190 200 210 220 230 290 300 310 320 330 340 pF1KE9 LRLTAVVLASAVAFFVPSNLLLLLHYSDPSPSAWG-NLYGAYVPSLALSTLNSCVDPFIY . :.:::: . :. :.:.:..:: : : .: . : .: .: :: ::.:.:::.: CCDS14 VGLAAVVLLAFVTCFAPNNFVLLAHIV--SRLFYGKSYYHVYKLTLCLSCLNNCLDPFVY 240 250 260 270 280 290 350 360 370 380 pF1KE9 YYVSAEFRDKVRAGL-FQRSPGDTVASKASAEGGSRGMGTHSSLLQ :..: ::. ..: : .: : ::. .. . ..: ...: CCDS14 YFASREFQLRLREYLGCRRVPRDTLDTRRESLFSARTTSVRSEAGAHPEGMEGATRPGLQ 300 310 320 330 340 350 CCDS14 RQESVF >>CCDS2148.1 GPR17 gene_id:2840|Hs108|chr2 (367 aa) initn: 421 init1: 316 opt: 479 Z-score: 402.5 bits: 83.2 E(32554): 4.3e-16 Smith-Waterman score: 479; 32.0% identity (60.3% similar) in 325 aa overlap (35-348:22-333) 10 20 30 40 50 60 pF1KE9 LLLWPLVLGFSLSGGTQTPSVYDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDTLELP :.::. :. . :: . . : : CCDS21 MSKRSWWAGSRKPPREMLKLSGSDSSQSMNGLEVAPPGLITNFSLATAEQC 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 DSSRALLLGWVPTRLVPALYGLVLVVGLPANGLALWVLATQAPR-LPSTMLLMNLATADL . : . : ..: : ....: .: ::::.. . :....::.::.::: CCDS21 GQETPL-----ENMLFASFYLLDFILALVGNTLALWLFIRDHKSGTPANVFLMHLAVADL 60 70 80 90 100 130 140 150 160 170 180 pF1KE9 LLALALPPRIAYHLRGQRWPFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVHPLR .:.:: :..::. :..::::: ::::. .: .::.:. .:. .: ::.::.:::.. CCDS21 SCVLVLPTRLVYHFSGNHWPFGEIACRLTGFLFYLNMYASIYFLTCISADRFLAIVHPVK 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE9 ARALRGRRLALGLCMAAWLMAAALALPLTLQRQTFRLARSDRVLCHDALPL-DAQASHWQ . :: : : :...:. :: .. :: . .. :.: : : .::: CCDS21 SLKLRRPLYAHLACAFLWVVVAVAMAPLLVSPQTVQTNHT--VVC---LQLYREKASH-- 170 180 190 200 210 250 260 270 280 290 pF1KE9 PAFTCLALLGCFLPLLAMLLCYGATLHTLAAS----GRRYGHALRLTAVVLASAVAFFVP :.. ::. : :... . :: ...: . : .:.:. :.::: .. ::: CCDS21 HALVSLAVAFTF-PFITTVTCYLLIIRSLRQGLRVEKRLKTKAVRMIAIVLAIFLVCFVP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE9 SNL---LLLLHYSDPSPSAWGNLYGAYVPSLA--LSTLNSCVDPFIYYYVSAEFRDKVRA .. . .::: . . : . : . .. :..::. .::..:..:. .:: CCDS21 YHVNRSVYVLHYRSHGASCATQRILALANRITSCLTSLNGALDPIMYFFVAEKFRHALCN 280 290 300 310 320 330 360 370 380 pF1KE9 GLFQRSPGDTVASKASAEGGSRGMGTHSSLLQ CCDS21 LLCGKRLKGPPPSFEGKTNESSLSAKSEL 340 350 360 >>CCDS33063.1 C5AR1 gene_id:728|Hs108|chr19 (350 aa) initn: 387 init1: 345 opt: 477 Z-score: 401.1 bits: 82.8 E(32554): 5.1e-16 Smith-Waterman score: 477; 31.1% identity (63.3% similar) in 305 aa overlap (56-355:15-315) 30 40 50 60 70 80 pF1KE9 YDESGSTGGGDDSTPSILPAPRGYPGQVCANDSDTLEL--P-DSSRALLLGWVPTRLVPA .:.:::.: : :.. : :: :. . CCDS33 MDSFNYTTPDYGHYDDKDTLDLNTPVDKTSNTL--RVPDILALV 10 20 30 40 90 100 110 120 130 140 pF1KE9 LYGLVLVVGLPANGLALWVLATQAPRLPSTMLLMNLATADLLLALALPPRIAYHLRGQRW ....:..::. .:.:..:: : .: : ... ..:::.::.: :::: .. .. ..: CCDS33 IFAVVFLVGVLGNALVVWVTAFEAKRTINAIWFLNLAVADFLSCLALPILFTSIVQHHHW 50 60 70 80 90 100 150 160 170 180 190 200 pF1KE9 PFGEAACRLATAALYGHMYGSVLLLAAVSLDRYLALVHPLRARALRGRRLALGLCMAAWL ::: ::: . . . .::.:.::::..: ::.: . .:. . .:: :: : .:: CCDS33 PFGGAACSILPSLILLNMYASILLLATISADRFLLVFKPIWCQNFRGAGLAWIACAVAWG 110 120 130 140 150 160 210 220 230 240 250 260 pF1KE9 MAAALALPLTLQRQTFRLARSDRVLCHDALPLDAQASHWQPAFTCLALLGCFLPLLAMLL .: :..: : : . . .::: : . . :.. : .:: . :::.. . CCDS33 LALLLTIPSFLYRVVREEYFPPKVLCGVDYSHDKRRER-AVAIVRL-VLGFLWPLLTLTI 170 180 190 200 210 220 270 280 290 300 310 320 pF1KE9 CYG-ATLHTLAASGRRYGHALRLTAVVLASAVAFFVPSNLL-LLLHYSDPSPSAWGNLYG :: :.: . . : ..:.....:.:: :..: .. ... . .:: .. : CCDS33 CYTFILLRTWSRRATRSTKTLKVVVAVVASFFIFWLPYQVTGIMMSFLEPSSPTFLLLKK 230 240 250 260 270 280 330 340 350 360 370 380 pF1KE9 AYVPSLALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSPGDTVASKASAEGGSRGMGTH .... .: :..:.:: .. :. ..: .: CCDS33 LDSLCVSFAYINCCINPIIYVVAGQGFQGRLRKSLPSLLRNVLTEESVVRESKSFTRSTV 290 300 310 320 330 340 pF1KE9 SSLLQ CCDS33 DTMAQKTQAV 350 >>CCDS9412.1 CYSLTR2 gene_id:57105|Hs108|chr13 (346 aa) initn: 318 init1: 268 opt: 465 Z-score: 391.5 bits: 81.1 E(32554): 1.7e-15 Smith-Waterman score: 465; 28.9% identity (60.7% similar) in 305 aa overlap (65-360:26-325) 40 50 60 70 80 90 pF1KE9 GDDSTPSILPAPRGYPGQVCANDSDTLELPDSSRALLLGWVPTRLVPALYGLVLVVGLPA ..:: . .. : .: ... :. . CCDS94 MERKFMSLQPSISVSEMEPNGTFSNNNSRNCTIENFKREFFPIVYLIIFFWGVLG 10 20 30 40 50 100 110 120 130 140 150 pF1KE9 NGLALWVLATQAPRLPST-MLLMNLATADLLLALALPPRIAYHLRGQRWPFGEAACRLAT :::...:. . :. ....::: .:::. .:: : :.:::. : ::. :::. . CCDS94 NGLSIYVFLQPYKKSTSVNVFMLNLAISDLLFISTLPFRADYYLRGSNWIFGDLACRIMS 60 70 80 90 100 110 160 170 180 190 200 210 pF1KE9 AALYGHMYGSVLLLAAVSLDRYLALVHPLRARALRGRRLALGLCMAAWLMAAALALPLTL .:: .::.:. .:...:. :.::.:::.: . . : : :: :.. : .. . : CCDS94 YSLYVNMYSSIYFLTVLSVVRFLAMVHPFRLLHVTSIRSAWILCGIIWILIMASSI-MLL 120 130 140 150 160 170 220 230 240 250 260 270 pF1KE9 QRQTFRLARSDRVLCHDALPLDAQASHWQPAFTCLALLGCFLPLLAMLLCYGATLHTL-- . . .. : : : :. . : ..::.::.... .:: ...: CCDS94 DSGS---EQNGSVTSCLELNLYKIAKLQTMNYIAL-VVGCLLPFFTLSICYLLIIRVLLK 180 190 200 210 220 230 280 290 300 310 320 pF1KE9 ---AASGRRYGHALRLTAVVLASAVAF--FVPSNLLLLLHYSDPSPS-AWGNLYGAYVPS :: : .: ::..... . : :.: . : .: . . . :. : : . CCDS94 VEVPESGLRVSHRKALTTIIITLIIFFLCFLPYHTLRTVHLTTWKVGLCKDRLHKALVIT 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE9 LALSTLNSCVDPFIYYYVSAEFRDKVRAGLFQRSPGDTVASKASAEGGSRGMGTHSSLLQ :::.. :.: .:..::... .:.:.....: . : CCDS94 LALAAANACFNPLLYYFAGENFKDRLKSALRKGHPQKAKTKCVFPVSVWLRKETRV 300 310 320 330 340 385 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 07:02:46 2016 done: Sun Nov 6 07:02:46 2016 Total Scan time: 2.760 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]