FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9423, 812 aa 1>>>pF1KE9423 812 - 812 aa - 812 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.2015+/-0.00124; mu= 17.4592+/- 0.074 mean_var=169.4797+/-31.469, 0's: 0 Z-trim(107.9): 246 B-trim: 12 in 2/48 Lambda= 0.098518 statistics sampled from 9617 (9890) to 9617 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.657), E-opt: 0.2 (0.304), width: 16 Scan time: 2.990 The best scores are: opt bits E(32554) CCDS32935.1 ADGRE2 gene_id:30817|Hs108|chr19 ( 823) 2898 425.4 1.9e-118 CCDS59361.1 ADGRE2 gene_id:30817|Hs108|chr19 ( 765) 2892 424.5 3.3e-118 CCDS32929.1 ADGRE5 gene_id:976|Hs108|chr19 ( 835) 2437 359.9 1e-98 CCDS12315.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 652) 1783 266.8 8.4e-71 CCDS74296.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 526) 1762 263.7 5.8e-70 CCDS74297.1 ADGRE3 gene_id:84658|Hs108|chr19 ( 600) 1760 263.5 7.7e-70 CCDS32930.1 ADGRE5 gene_id:976|Hs108|chr19 ( 786) 1412 214.2 7e-55 CCDS58644.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 821) 1279 195.3 3.5e-49 CCDS12175.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 886) 1249 191.1 7.1e-48 CCDS58646.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 745) 1229 188.1 4.6e-47 CCDS58643.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 709) 1221 187.0 9.8e-47 CCDS41352.1 ADGRL4 gene_id:64123|Hs108|chr1 ( 690) 1039 161.1 5.9e-39 CCDS32931.1 ADGRE5 gene_id:976|Hs108|chr19 ( 742) 981 152.9 1.9e-36 CCDS76174.1 ADGRL2 gene_id:23266|Hs108|chr1 (1123) 894 140.7 1.3e-32 CCDS72811.1 ADGRL2 gene_id:23266|Hs108|chr1 (1177) 894 140.8 1.3e-32 CCDS689.1 ADGRL2 gene_id:23266|Hs108|chr1 (1403) 894 140.9 1.5e-32 CCDS81345.1 ADGRL2 gene_id:23266|Hs108|chr1 (1416) 894 140.9 1.5e-32 CCDS12307.1 ADGRL1 gene_id:22859|Hs108|chr19 (1469) 871 137.6 1.4e-31 CCDS32928.1 ADGRL1 gene_id:22859|Hs108|chr19 (1474) 871 137.6 1.4e-31 CCDS82926.1 ADGRL3 gene_id:23284|Hs108|chr4 (1240) 848 134.3 1.3e-30 CCDS54768.1 ADGRL3 gene_id:23284|Hs108|chr4 (1469) 848 134.4 1.4e-30 CCDS58645.1 ADGRE1 gene_id:2015|Hs108|chr19 ( 867) 804 127.8 7.7e-29 CCDS35409.1 ADGRG4 gene_id:139378|Hs108|chrX (3080) 631 103.9 4.2e-21 CCDS9272.1 ADGRD1 gene_id:283383|Hs108|chr12 ( 874) 611 100.4 1.4e-20 CCDS81753.1 ADGRD1 gene_id:283383|Hs108|chr12 ( 906) 611 100.4 1.4e-20 CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 588 97.8 2.9e-19 CCDS2775.1 CELSR3 gene_id:1951|Hs108|chr3 (3312) 564 94.4 3.2e-18 CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923) 551 92.5 1.1e-17 CCDS33159.2 ADGRF3 gene_id:165082|Hs108|chr2 ( 873) 482 82.0 4.6e-15 CCDS46238.1 ADGRF3 gene_id:165082|Hs108|chr2 ( 997) 482 82.1 5e-15 CCDS46239.1 ADGRF3 gene_id:165082|Hs108|chr2 (1079) 482 82.2 5.3e-15 CCDS72746.1 ADGRB2 gene_id:576|Hs108|chr1 (1551) 469 80.5 2.4e-14 CCDS64985.1 ADGRB1 gene_id:575|Hs108|chr8 (1584) 459 79.1 6.4e-14 CCDS10786.1 ADGRG3 gene_id:222487|Hs108|chr16 ( 549) 413 72.0 3.1e-12 CCDS32461.1 ADGRG1 gene_id:9289|Hs108|chr16 ( 687) 413 72.1 3.6e-12 CCDS73893.1 ADGRG1 gene_id:9289|Hs108|chr16 ( 692) 413 72.1 3.6e-12 CCDS13149.1 CD93 gene_id:22918|Hs108|chr20 ( 652) 411 71.8 4.2e-12 CCDS4968.1 ADGRB3 gene_id:577|Hs108|chr6 (1522) 413 72.5 5.8e-12 CCDS72747.1 ADGRB2 gene_id:576|Hs108|chr1 (1584) 412 72.4 6.6e-12 CCDS54786.1 NPNT gene_id:255743|Hs108|chr4 ( 566) 399 70.0 1.3e-11 CCDS54785.1 NPNT gene_id:255743|Hs108|chr4 ( 595) 399 70.0 1.3e-11 CCDS76879.1 ADGRG3 gene_id:222487|Hs108|chr16 ( 429) 394 69.1 1.7e-11 CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 390 69.3 5.7e-11 CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 390 69.3 5.8e-11 CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 390 69.3 5.8e-11 CCDS9831.1 LTBP2 gene_id:4053|Hs108|chr14 (1821) 389 69.2 6.9e-11 CCDS47491.1 ADGRG6 gene_id:57211|Hs108|chr6 (1193) 386 68.6 7.2e-11 CCDS47490.1 ADGRG6 gene_id:57211|Hs108|chr6 (1221) 386 68.6 7.3e-11 CCDS55064.1 ADGRG6 gene_id:57211|Hs108|chr6 (1222) 386 68.6 7.3e-11 CCDS47489.1 ADGRG6 gene_id:57211|Hs108|chr6 (1250) 386 68.6 7.4e-11 >>CCDS32935.1 ADGRE2 gene_id:30817|Hs108|chr19 (823 aa) initn: 2868 init1: 2868 opt: 2898 Z-score: 2240.0 bits: 425.4 E(32554): 1.9e-118 Smith-Waterman score: 5544; 97.8% identity (98.4% similar) in 823 aa overlap (1-812:1-823) 10 20 30 40 50 60 pF1KE9 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARWCPQDSSCVNATACRCNPGFSSFSEIITT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARWCPQDSSCVNATACRCNPGFSSFSEIITT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 PMETCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PMETCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDVNECTSGQNPCHSSTHC ::::::::::::::::::::::::::::::::. :::::.:::::::::::::::::::: CCDS32 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKLKPEDPKLCTDVNECTSGQNPCHSSTHC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDYKPGLANNT ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS32 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRFFDKVQDLGRDYKPGLANNT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 IQSILQALDELLEAPGDLETLPRLQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IQSILQALDELLEAPGDLETLPRLQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAG 310 320 330 340 350 360 370 380 390 400 pF1KE9 TELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPG-----------MGKLLAEAPLV :::::::::::::::::::::::::::::::::::::: ::::::::::: CCDS32 TELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPGPSVVGLVSIPGMGKLLAEAPLV 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE9 LEPEKQMLLHETHQGLLQDGSPILLSDVISAFLSNNDTQNLSSPVTFTFSHRSVIPRQKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LEPEKQMLLHETHQGLLQDGSPILLSDVISAFLSNNDTQNLSSPVTFTFSHRSVIPRQKV 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE9 LCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVIT 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE9 YMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 YMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCS 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE9 IIAGILHYLYLATFTWMLLEALYLFLTARNLTVVNYSSINRFMKKLMFPVGYGVPAVTVA :::: ::::::::.:::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IIAGTLHYLYLATLTWMLLEALYLFLTARNLTVVNYSSINRFMKKLMFPVGYGVPAVTVA 610 620 630 640 650 660 650 660 670 680 690 700 pF1KE9 ISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS32 ISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSE 670 680 690 700 710 720 710 720 730 740 750 760 pF1KE9 VSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCL 730 740 750 760 770 780 770 780 790 800 810 pF1KE9 LSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN ::::::::::::::::::::::::::::::::::::::::::: CCDS32 LSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN 790 800 810 820 >>CCDS59361.1 ADGRE2 gene_id:30817|Hs108|chr19 (765 aa) initn: 4737 init1: 2868 opt: 2892 Z-score: 2235.7 bits: 424.5 E(32554): 3.3e-118 Smith-Waterman score: 4995; 90.8% identity (91.4% similar) in 823 aa overlap (1-812:1-765) 10 20 30 40 50 60 pF1KE9 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARWCPQDSSCVNATACRCNPGFSSFSEIITT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARWCPQDSSCVNATACRCNPGFSSFSEIITT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 PMETCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 PMETCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDVNECTSGQNPCHSSTHC ::::::::::::::::::::::::::::::::. :::::.:::::::::::::::::::: CCDS59 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKLKPEDPKLCTDVNECTSGQNPCHSSTHC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDYKPGLANNT ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS59 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRFFDKVQDLGRDYKPGLANNT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 IQSILQALDELLEAPGDLETLPRLQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 IQSILQALDELLEAPGDLETLPRLQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAG 310 320 330 340 350 360 370 380 390 400 pF1KE9 TELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPG-----------MGKLLAEAPLV :::::::::::::::::::::::::::::::::::::: ::::::::::: CCDS59 TELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPGPSVVGLVSIPGMGKLLAEAPLV 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE9 LEPEKQMLLHETHQGLLQDGSPILLSDVISAFLSNNDTQNLSSPVTFTFSHRSVIPRQKV :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LEPEKQMLLHETHQGLLQDGSPILLSDVISAFLSNNDTQNLSSPVTFTFSHR-------- 430 440 450 460 470 470 480 490 500 510 520 pF1KE9 LCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVIT :::::::::: CCDS59 --------------------------------------------------EEDPVLTVIT 480 530 540 550 560 570 580 pF1KE9 YMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 YMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCS 490 500 510 520 530 540 590 600 610 620 630 640 pF1KE9 IIAGILHYLYLATFTWMLLEALYLFLTARNLTVVNYSSINRFMKKLMFPVGYGVPAVTVA :::: ::::::::.:::::::::::::::::::::::::::::::::::::::::::::: CCDS59 IIAGTLHYLYLATLTWMLLEALYLFLTARNLTVVNYSSINRFMKKLMFPVGYGVPAVTVA 550 560 570 580 590 600 650 660 670 680 690 700 pF1KE9 ISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS59 ISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSE 610 620 630 640 650 660 710 720 730 740 750 760 pF1KE9 VSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 VSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCL 670 680 690 700 710 720 770 780 790 800 810 pF1KE9 LSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN ::::::::::::::::::::::::::::::::::::::::::: CCDS59 LSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN 730 740 750 760 >>CCDS32929.1 ADGRE5 gene_id:976|Hs108|chr19 (835 aa) initn: 3470 init1: 2412 opt: 2437 Z-score: 1885.8 bits: 359.9 E(32554): 1e-98 Smith-Waterman score: 3545; 61.2% identity (80.5% similar) in 837 aa overlap (1-807:1-826) 10 20 30 40 50 60 pF1KE9 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARWCPQDSSCVNATACRCNPGFSSFSEIITT :::::: ::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS32 MGGRVF---LAFCVWLTLPGAETQDSRGCARWCPQNSSCVNATACRCNPGFSSFSEIITT 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 PMETCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV : ::::::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PTETCDDINECATPSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE9 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDVNECTSGQNPCHSSTHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDVNECTSGQNPCHSSTHC 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE9 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE9 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDYKPGLANNT ::::::::::::::::::::::::::::::::::::::::.:::::::::: : . :. : CCDS32 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRFFDKVQDLGRDSKTSSAEVT 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE9 IQSILQALDELLEAPGDLETLPRLQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAG ::.... .:::.:::::.:.: .: .:..::..:::..: :.:.: .: ... :.. CCDS32 IQNVIKLVDELMEAPGDVEALAPPVRHLIATQLLSNLEDIMRILAKSLPKGPFTYISPSN 300 310 320 330 340 350 370 380 390 400 pF1KE9 TELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPG-----------MGKLLAEAPLV :::.: .:.. :..::. :..: :.:.: : . ::: : :::.: : CCDS32 TELTLMIQERGDKNVTMGQSSARMKLNWAVAAGAEDPGPAVAGILSIQNMTTLLANASLN 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE9 LEPEKQMLLHETHQGLLQDGSPILLSDVISAFLSNNDTQNLSSPVTFTFSH--------- :. .:: :.: ... .. . :: : : :::.:.:..:.::. :.::: CCDS32 LHSKKQAELEEIYESSIRGVQLRRLSAVNSIFLSHNNTKELNSPILFAFSHLESSDGEAG 420 430 440 450 460 470 470 480 490 500 510 pF1KE9 -----RSVIP--RQKVLCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLM ..:.: ::..::.::. .. ::::: ::...:... :: :.:.::::::.:: CCDS32 RDPPAKDVMPGPRQELLCAFWKSDSDRGGHWATEGCQVLGSKNGSTTCQCSHLSSFAILM 480 490 500 510 520 530 520 530 540 550 560 570 pF1KE9 AHYDVQEEDPVLTVITYMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHL ::::: :: ::.:: .::..::.:::: ::::: . ::.. :..::.: .:::.. CCDS32 AHYDV--EDWKLTLITRVGLALSLFCLLLCILTFLLVRPIQGSRTTIHLHLCICLFVGST 540 550 560 570 580 590 580 590 600 610 620 630 pF1KE9 LFLVAIDQTGHKV--LCSIIAGILHYLYLATFTWMLLEALYL-FLTARNLTVVNYSSINR .::..:.. : .: : ..::.::: .::.: :: ::.: : ::..: . . :. CCDS32 IFLAGIENEGGQVGLRCRLVAGLLHYCFLAAFCWMSLEGLELYFLVVRVFQGQGLST--- 600 610 620 630 640 650 640 650 660 670 680 690 pF1KE9 FMKKLMFPVGYGVPAVTVAISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLV . . .::::: . :..::: . :: : :::. :.::.:.::::: :. : : CCDS32 ---RWLCLIGYGVPLLIVGVSAAIYSKGYGRPRYCWLDFEQGFLWSFLGPVTFIILCNAV 660 670 680 690 700 700 710 720 730 740 750 pF1KE9 LFLVTLWILKNRLSSLNSDVSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAY .:..:.: : ...: .: :.. :...: :.. : ::::.::::: .:.. . :..: CCDS32 IFVTTVWKLTQKFSEINPDMKKLKKARALTITAIAQLFLLGCTWVFGLFIFDDRSLVLTY 710 720 730 740 750 760 760 770 780 790 800 810 pF1KE9 LFTIINSLQGVFIFLVYCLLSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPST .:::.: :::.:..:..:::...:::.: ::. . . ::. . .:.. . .. CCDS32 VFTILNCLQGAFLYLLHCLLNKKVREEYRKWACLVAGGSKYSEFTSTTSGTGHNQTRALR 770 780 790 800 810 820 pF1KE9 VN CCDS32 ASESGI 830 >>CCDS12315.1 ADGRE3 gene_id:84658|Hs108|chr19 (652 aa) initn: 2019 init1: 1538 opt: 1783 Z-score: 1384.6 bits: 266.8 E(32554): 8.4e-71 Smith-Waterman score: 1913; 50.6% identity (71.8% similar) in 670 aa overlap (148-809:7-639) 120 130 140 150 160 170 pF1KE9 QDVDECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDVNECTSGQNPCHSS :::. :. . :. .. . .. : ..: CCDS12 MQGPLLLPGLCFLLSLFGAVTQKTKTSCAKCPPNAS 10 20 30 180 190 200 210 220 230 pF1KE9 THCLNNVGSYQCRCRPGWQPIPGSP--NGPNNTVCEDVDECSSGQH-QCDSSTVCFNTVG :.::. .: : :. :. . : .: :.:..::. : ..::.:. : CCDS12 --CVNNT---HCTCNHGYTSGSGQKLFTFPLET-CNDINECTPPYSVYCGFNAVCYNVEG 40 50 60 70 80 90 240 250 260 270 280 290 pF1KE9 SYSCRCRPGWKPRHGIP--NNQKDTVCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDY :. :.: ::.. . : .:.....:.: : : : . :... :: ..: CCDS12 SFYCQCVPGYRLHSGNEQFSNSNENTCQDTTSSKTTEG----RKELQKIVDKFESL---- 100 110 120 130 140 300 310 320 330 340 350 pF1KE9 KPGLANNTIQSILQALDELLEAPGDLETLPR-LQQHCVASHLLDGLEDVLRGLSKNLSNG :.:.: : . : . :. : .... . . : : . ::. ..: CCDS12 ---LTNQT----LWRTEGRQEISSTATTILRDVESKVLETALKDPEQKVLK-----IQND 150 160 170 180 190 360 370 380 390 400 410 pF1KE9 LLNFSYPAGTELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPGMGKLLAEAPLVLE . . : :. : .: . .: . ... . : :.. .: :. ... . : CCDS12 SVAIETQAITDNCSEERKTFNLNVQM-NSMDIRCSDIIQGDTQG-PSAIAFISYSSL--- 200 210 220 230 240 420 430 440 450 460 pF1KE9 PEKQMLLHETHQGLLQDGSPILL-SDVISAFLSNNDTQNLSSPVTFTFSHRSVIPR-QKV ... : .. . . : :.:.:: .. . . .::. ::.::.: .. : .:: CCDS12 ---GNIINATFFEEMDKKDQVYLNSQVVSAAIGPKRNVSLSKSVTLTFQHVKMTPSTKKV 250 260 270 280 290 300 470 480 490 500 510 520 pF1KE9 LCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVIT .::.:. .: ..:. :: : . . :.: :.:::::::::: ::::::::::: CCDS12 FCVYWKSTGQG-SQWSRDGCFLIHVNKSHTMCNCSHLSSFAVLMA-LTSQEEDPVLTVIT 310 320 330 340 350 360 530 540 550 560 570 580 pF1KE9 YMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCS :.::::::::::::::::::::::.:::::::::::::::::::::::.::.: ::::: CCDS12 YVGLSVSLLCLLLAALTFLLCKAIRNTSTSLHLQLSLCLFLAHLLFLVGIDRTEPKVLCS 370 380 390 400 410 420 590 600 610 620 630 640 pF1KE9 IIAGILHYLYLATFTWMLLEALYLFLTARNLTVVNYSSINRFMKKLMFPVGYGVPAVTVA :::: :::::::.:::::::...::::::::::::::::::.:: .:::::::::::::: CCDS12 IIAGALHYLYLAAFTWMLLEGVHLFLTARNLTVVNYSSINRLMKWIMFPVGYGVPAVTVA 430 440 450 460 470 480 650 660 670 680 690 700 pF1KE9 ISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSD ::::: :::::: .::::. ..::.:.::::::::::.:::::....:::: .::::::. CCDS12 ISAASWPHLYGTADRCWLHLDQGFMWSFLGPVCAIFSANLVLFILVFWILKRKLSSLNSE 490 500 510 520 530 540 710 720 730 740 750 760 pF1KE9 VSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCL :::..:::::::::::::::::::::::.:::::::.:::::::::::::: :::::::: CCDS12 VSTIQNTRMLAFKATAQLFILGCTWCLGLLQVGPAAQVMAYLFTIINSLQGFFIFLVYCL 550 560 570 580 590 600 770 780 790 800 810 pF1KE9 LSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN :::::..:: :: . : : :.::: .::::. : :::: CCDS12 LSQQVQKQYQKWFREIVKSKSESETYTLSSKMGPD-SKPSEGDVFPGQVKRKY 610 620 630 640 650 >>CCDS74296.1 ADGRE3 gene_id:84658|Hs108|chr19 (526 aa) initn: 1915 init1: 1538 opt: 1762 Z-score: 1369.5 bits: 263.7 E(32554): 5.8e-70 Smith-Waterman score: 1762; 62.2% identity (81.5% similar) in 460 aa overlap (355-809:58-513) 330 340 350 360 370 380 pF1KE9 QQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAGTELSLEVQKQVDRSVTLRQNQAV- :..: : ..:.: .: :.. . CCDS74 CAKCPPNASCVNNTHCTCNHGYTSGSGQKLFTFPLETCNAIETQAITDNCSEERKTFNLN 30 40 50 60 70 80 390 400 410 420 430 440 pF1KE9 MQLDWNQAQKSGDPGMGKLLAEAPLVLEPEKQM--LLHETHQGLLQDGSPILL-SDVISA .:.. .. . .: .: . . ... ... ... : .. . . : :.:.:: CCDS74 VQMN-SMDIRCSDIIQGDTQGPSAIAFISYSSLGNIINATFFEEMDKKDQVYLNSQVVSA 90 100 110 120 130 140 450 460 470 480 490 pF1KE9 FLSNNDTQNLSSPVTFTFSHRSVIPR-QKVLCVFWEHGQNGCGHWATTGCSTIGTRDTST .. . . .::. ::.::.: .. : .::.::.:. .: ..:. :: : . . : CCDS74 AIGPKRNVSLSKSVTLTFQHVKMTPSTKKVFCVYWKSTGQG-SQWSRDGCFLIHVNKSHT 150 160 170 180 190 200 500 510 520 530 540 550 pF1KE9 ICRCTHLSSFAVLMAHYDVQEEDPVLTVITYMGLSVSLLCLLLAALTFLLCKAIQNTSTS .: :.:::::::::: ::::::::::::.::::::::::::::::::::::.::::: CCDS74 MCNCSHLSSFAVLMA-LTSQEEDPVLTVITYVGLSVSLLCLLLAALTFLLCKAIRNTSTS 210 220 230 240 250 260 560 570 580 590 600 610 pF1KE9 LHLQLSLCLFLAHLLFLVAIDQTGHKVLCSIIAGILHYLYLATFTWMLLEALYLFLTARN ::::::::::::::::::.::.: ::::::::: :::::::.:::::::...::::::: CCDS74 LHLQLSLCLFLAHLLFLVGIDRTEPKVLCSIIAGALHYLYLAAFTWMLLEGVHLFLTARN 270 280 290 300 310 320 620 630 640 650 660 670 pF1KE9 LTVVNYSSINRFMKKLMFPVGYGVPAVTVAISAASRPHLYGTPSRCWLQPEKGFIWGFLG :::::::::::.:: .::::::::::::::::::: :::::: .::::. ..::.:.::: CCDS74 LTVVNYSSINRLMKWIMFPVGYGVPAVTVAISAASWPHLYGTADRCWLHLDQGFMWSFLG 330 340 350 360 370 380 680 690 700 710 720 730 pF1KE9 PVCAIFSVNLVLFLVTLWILKNRLSSLNSDVSTLRNTRMLAFKATAQLFILGCTWCLGIL :::::::.:::::....:::: .::::::.:::..:::::::::::::::::::::::.: CCDS74 PVCAIFSANLVLFILVFWILKRKLSSLNSEVSTIQNTRMLAFKATAQLFILGCTWCLGLL 390 400 410 420 430 440 740 750 760 770 780 790 pF1KE9 QVGPAARVMAYLFTIINSLQGVFIFLVYCLLSQQVREQYGKWSKGIRKLKTESEMHTLSS ::::::.:::::::::::::: :::::::::::::..:: :: . : : :.::: .:::: CCDS74 QVGPAAQVMAYLFTIINSLQGFFIFLVYCLLSQQVQKQYQKWFREIVKSKSESETYTLSS 450 460 470 480 490 500 800 810 pF1KE9 SAKADTSKPSTVN . : :::: CCDS74 KMGPD-SKPSEGDVFPGQVKRKY 510 520 >>CCDS74297.1 ADGRE3 gene_id:84658|Hs108|chr19 (600 aa) initn: 1954 init1: 1538 opt: 1760 Z-score: 1367.3 bits: 263.5 E(32554): 7.7e-70 Smith-Waterman score: 1764; 53.1% identity (72.3% similar) in 593 aa overlap (222-809:30-587) 200 210 220 230 240 pF1KE9 RPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRCRPGWKPRHG-- .: .. : :.. : : :. : CCDS74 MQGPLLLPGLCFLLSLFGAVTQKTKTSCAKCPPNASCVNNT---HCTCNHGYTSGSGQK 10 20 30 40 50 250 260 270 280 290 300 pF1KE9 IPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDYKPGLANNTIQSILQALD . . .: :.: : : : . :... :: ..: :.:.: : . CCDS74 LFTFPLET-CNDTTSSKTTEG----RKELQKIVDKFESL-------LTNQT----LWRTE 60 70 80 90 100 310 320 330 340 350 360 pF1KE9 ELLEAPGDLETLPR-LQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAGTELSLEVQ : . :. : .... . . : : . ::. ..: . . : :. : . CCDS74 GRQEISSTATTILRDVESKVLETALKDPEQKVLK-----IQNDSVAIETQAITDNCSEER 110 120 130 140 150 370 380 390 400 410 420 pF1KE9 KQVDRSVTLRQNQAVMQLDWNQAQKSGDPGMGKLLAEAPLVLEPEKQMLLHETHQGLLQD : . .: . ... . : :.. .: :. ... . : ... : .. CCDS74 KTFNLNVQM-NSMDIRCSDIIQGDTQG-PSAIAFISYSSL------GNIINATFFEEMDK 160 170 180 190 200 430 440 450 460 470 480 pF1KE9 GSPILL-SDVISAFLSNNDTQNLSSPVTFTFSHRSVIPR-QKVLCVFWEHGQNGCGHWAT . . : :.:.:: .. . . .::. ::.::.: .. : .::.::.:. .: ..:. CCDS74 KDQVYLNSQVVSAAIGPKRNVSLSKSVTLTFQHVKMTPSTKKVFCVYWKSTGQG-SQWSR 210 220 230 240 250 260 490 500 510 520 530 540 pF1KE9 TGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVITYMGLSVSLLCLLLAALT :: : . . :.: :.:::::::::: ::::::::::::.::::::::::::::: CCDS74 DGCFLIHVNKSHTMCNCSHLSSFAVLMA-LTSQEEDPVLTVITYVGLSVSLLCLLLAALT 270 280 290 300 310 320 550 560 570 580 590 600 pF1KE9 FLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCSIIAGILHYLYLATFTWM :::::::.:::::::::::::::::::::::.::.: ::::::::: :::::::.:::: CCDS74 FLLCKAIRNTSTSLHLQLSLCLFLAHLLFLVGIDRTEPKVLCSIIAGALHYLYLAAFTWM 330 340 350 360 370 380 610 620 630 640 650 660 pF1KE9 LLEALYLFLTARNLTVVNYSSINRFMKKLMFPVGYGVPAVTVAISAASRPHLYGTPSRCW :::...::::::::::::::::::.:: .::::::::::::::::::: :::::: .::: CCDS74 LLEGVHLFLTARNLTVVNYSSINRLMKWIMFPVGYGVPAVTVAISAASWPHLYGTADRCW 390 400 410 420 430 440 670 680 690 700 710 720 pF1KE9 LQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSDVSTLRNTRMLAFKATAQ :. ..::.:.::::::::::.:::::....:::: .::::::.:::..:::::::::::: CCDS74 LHLDQGFMWSFLGPVCAIFSANLVLFILVFWILKRKLSSLNSEVSTIQNTRMLAFKATAQ 450 460 470 480 490 500 730 740 750 760 770 780 pF1KE9 LFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCLLSQQVREQYGKWSKGIR :::::::::::.:::::::.:::::::::::::: :::::::::::::..:: :: . : CCDS74 LFILGCTWCLGLLQVGPAAQVMAYLFTIINSLQGFFIFLVYCLLSQQVQKQYQKWFREIV 510 520 530 540 550 560 790 800 810 pF1KE9 KLKTESEMHTLSSSAKADTSKPSTVN : :.::: .::::. : :::: CCDS74 KSKSESETYTLSSKMGPD-SKPSEGDVFPGQVKRKY 570 580 590 600 >>CCDS32930.1 ADGRE5 gene_id:976|Hs108|chr19 (786 aa) initn: 2583 init1: 1398 opt: 1412 Z-score: 1098.7 bits: 214.2 E(32554): 7e-55 Smith-Waterman score: 3047; 55.3% identity (74.7% similar) in 837 aa overlap (1-807:1-777) 10 20 30 40 50 60 pF1KE9 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARWCPQDSSCVNATACRCNPGFSSFSEIITT :::::: ::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS32 MGGRVF---LAFCVWLTLPGAETQDSRGCARWCPQNSSCVNATACRCNPGFSSFSEIITT 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 PMETCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV : ::::::::::: :::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PTETCDDINECATPSKVSCGKFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE9 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDVNECTSGQNPCHSSTHC :::::::::::::::::::::::::::::::::::::::::::: CCDS32 DECQQNPRLCKSYGTCVNTLGSYTCQCLPGFKFIPEDPKVCTDV---------------- 120 130 140 150 160 190 200 210 220 230 240 pF1KE9 LNNVGSYQCRCRPGWQPIPGSPNGPNNTVCEDVDECSSGQHQCDSSTVCFNTVGSYSCRC ::::::::::::::::::::::::::: CCDS32 ---------------------------------DECSSGQHQCDSSTVCFNTVGSYSCRC 170 180 250 260 270 280 290 300 pF1KE9 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDYKPGLANNT ::::::::::::::::::::::::::::::::::::::::.:::::::::: : . :. : CCDS32 RPGWKPRHGIPNNQKDTVCEDMTFSTWTPPPGVHSQTLSRFFDKVQDLGRDSKTSSAEVT 190 200 210 220 230 240 310 320 330 340 350 360 pF1KE9 IQSILQALDELLEAPGDLETLPRLQQHCVASHLLDGLEDVLRGLSKNLSNGLLNFSYPAG ::.... .:::.:::::.:.: .: .:..::..:::..: :.:.: .: ... :.. CCDS32 IQNVIKLVDELMEAPGDVEALAPPVRHLIATQLLSNLEDIMRILAKSLPKGPFTYISPSN 250 260 270 280 290 300 370 380 390 400 pF1KE9 TELSLEVQKQVDRSVTLRQNQAVMQLDWNQAQKSGDPG-----------MGKLLAEAPLV :::.: .:.. :..::. :..: :.:.: : . ::: : :::.: : CCDS32 TELTLMIQERGDKNVTMGQSSARMKLNWAVAAGAEDPGPAVAGILSIQNMTTLLANASLN 310 320 330 340 350 360 410 420 430 440 450 460 pF1KE9 LEPEKQMLLHETHQGLLQDGSPILLSDVISAFLSNNDTQNLSSPVTFTFSH--------- :. .:: :.: ... .. . :: : : :::.:.:..:.::. :.::: CCDS32 LHSKKQAELEEIYESSIRGVQLRRLSAVNSIFLSHNNTKELNSPILFAFSHLESSDGEAG 370 380 390 400 410 420 470 480 490 500 510 pF1KE9 -----RSVIP--RQKVLCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLM ..:.: ::..::.::. .. ::::: ::...:... :: :.:.::::::.:: CCDS32 RDPPAKDVMPGPRQELLCAFWKSDSDRGGHWATEGCQVLGSKNGSTTCQCSHLSSFAILM 430 440 450 460 470 480 520 530 540 550 560 570 pF1KE9 AHYDVQEEDPVLTVITYMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHL ::::: :: ::.:: .::..::.:::: ::::: . ::.. :..::.: .:::.. CCDS32 AHYDV--EDWKLTLITRVGLALSLFCLLLCILTFLLVRPIQGSRTTIHLHLCICLFVGST 490 500 510 520 530 540 580 590 600 610 620 630 pF1KE9 LFLVAIDQTGHKV--LCSIIAGILHYLYLATFTWMLLEALYL-FLTARNLTVVNYSSINR .::..:.. : .: : ..::.::: .::.: :: ::.: : ::..: . . :. CCDS32 IFLAGIENEGGQVGLRCRLVAGLLHYCFLAAFCWMSLEGLELYFLVVRVFQGQGLST--- 550 560 570 580 590 600 640 650 660 670 680 690 pF1KE9 FMKKLMFPVGYGVPAVTVAISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLV . . .::::: . :..::: . :: : :::. :.::.:.::::: :. : : CCDS32 ---RWLCLIGYGVPLLIVGVSAAIYSKGYGRPRYCWLDFEQGFLWSFLGPVTFIILCNAV 610 620 630 640 650 660 700 710 720 730 740 750 pF1KE9 LFLVTLWILKNRLSSLNSDVSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAY .:..:.: : ...: .: :.. :...: :.. : ::::.::::: .:.. . :..: CCDS32 IFVTTVWKLTQKFSEINPDMKKLKKARALTITAIAQLFLLGCTWVFGLFIFDDRSLVLTY 670 680 690 700 710 720 760 770 780 790 800 810 pF1KE9 LFTIINSLQGVFIFLVYCLLSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPST .:::.: :::.:..:..:::...:::.: ::. . . ::. . .:.. . .. CCDS32 VFTILNCLQGAFLYLLHCLLNKKVREEYRKWACLVAGGSKYSEFTSTTSGTGHNQTRALR 730 740 750 760 770 780 pF1KE9 VN CCDS32 ASESGI >>CCDS58644.1 ADGRE1 gene_id:2015|Hs108|chr19 (821 aa) initn: 1188 init1: 851 opt: 1279 Z-score: 996.4 bits: 195.3 E(32554): 3.5e-49 Smith-Waterman score: 1397; 34.6% identity (58.0% similar) in 842 aa overlap (19-807:74-819) 10 20 30 40 pF1KE9 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARW---CPQDSSCVNATA- ::.. .: :.. : .::: : .. CCDS58 YATCTNTVDSYYCACKQGFLSSNGQNHFKDPGVRCKDIDECSQSPQPCGPNSSCKNLSGR 50 60 70 80 90 100 50 60 70 80 90 pF1KE9 --CRCNPGFSSFSEIITTPME----TCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSP : : :::: . .: . .: ::::: : :.: : . ::: :. :::.: :. CCDS58 YKCSCLDGFSSPTGNDWVPGKPGNFSCTDINECLT-SSV-CPEHSDCVNSMGSYSCSCQV 110 120 130 140 150 160 100 110 120 130 140 150 pF1KE9 GYEPVSGAKTFKNESENTCQDVDECQQNPRLCKSYGTCVNTLGSYTCQCLPGFK-----F :. .: .: .::.::::: .:: : ..:: ::.:.:.: : :::. . CCDS58 GF--IS-----RN---STCEDVDECA-DPRACPEHATCNNTVGNYSCFCNPGFESSSGHL 170 180 190 200 210 160 170 180 190 200 210 pF1KE9 IPEDPKV-CTDVNECTSGQNPCHSSTHCLNNVGSYQCRCRPGWQPIPGSPNGPNNTV-CE . :. : :..::: . : .. : :. ::: : :.::. : :. : .. : :. CCDS58 SFQGLKASCEDIDECT---EMCPINSTCTNTPGSYFCTCHPGFAPSNGQLNFTDQGVECR 220 230 240 250 260 220 230 240 250 260 pF1KE9 DVDECSSGQHQCDSSTVCFNTVGSYSCRCRPGWKPRHGIPNNQKDT--VCEDMTFSTWTP :.::: . : ...: :..::::: : :..: ..::: :. . :. CCDS58 DIDECRQDPSTCGPNSICTNALGSYSCGCIAGFHPNP--EGSQKDGNFSCQRVLFKCKED 270 280 290 300 310 320 270 280 290 300 310 320 pF1KE9 PPGVHSQTLSRLFDKVQDLGRDYKPGLAN--NTIQSILQALDELLEAPGDLETL------ ..: ... :. : ::. .. :..:...::.. : . .: CCDS58 VIPDNKQ-----IQQCQE-GTAVKPAYVSFCAQINNIFSVLDKVCENKTTVVSLKNTTES 330 340 350 360 370 330 340 350 360 370 pF1KE9 --PRLQQHCVASHLLDGLEDVLRG--LSKNLSNGLLNFSYPAG-------TELSLEVQKQ : :.: . ... . : : . : : .: :.. :: :..... CCDS58 FVPVLKQISTWTKFTKEETSSLATVFLESVESMTLASFWKPSANITPAVRTEY-LDIESK 380 390 400 410 420 430 380 390 400 410 420 pF1KE9 V------DRSVTLR--QNQAVMQLDWNQAQKSGDPGMGKLLAEAPLVLEPEKQMLLHETH : ...::: . :.. . ..: . . . . .: . . . : CCDS58 VINKECSEENVTLDLVAKGDKMKIGCSTIEESESTETTGVAFVSFVGMESVLNERFFKDH 440 450 460 470 480 490 430 440 450 460 470 pF1KE9 QGLLQDGSPILL---SDVISAFLSNNDTQNLSSPVTFTFSHRSVIPRQKV---LCVFWEH :. : : : : : :........ ...:.:. .:. ... :.:: .:: : CCDS58 QAPLTT-SEIKLKMNSRVVGGIMTGEKKDGFSDPIIYTL--ENIQPKQKFERPICVSWST 500 510 520 530 540 550 480 490 500 510 520 530 pF1KE9 GQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVITYMGLSVS .: :.:.. :: . . .: ::: :......::.:: .. :: CCDS58 DVKG-GRWTSFGCVILEASETYTICSCNQMANLAVIMASGELT-----------MG---- 560 570 580 590 540 550 560 570 580 590 pF1KE9 LLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCSIIAGILH :.::::.:: CCDS58 ---------------------------------------------------CAIIAGFLH 600 600 610 620 630 640 650 pF1KE9 YLYLATFTWMLLEALYLFLTARNLTVVNYSSINRFMKKL-MFPVGYGVPAVTVAISAASR ::.:: : :::.::. ::: .::: :::: : .: .: : . :::.: ..:.:::. . CCDS58 YLFLACFFWMLVEAVILFLMVRNLKVVNYFS-SRNIKMLHICAFGYGLPMLVVVISASVQ 610 620 630 640 650 660 660 670 680 690 700 710 pF1KE9 PHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSDVSTLRN :. :: .::::. : ::::.::::::... .: .:. :::::..::::.:..::::.. CCDS58 PQGYGMHNRCWLNTETGFIWSFLGPVCTVIVINSLLLTWTLWILRQRLSSVNAEVSTLKD 670 680 690 700 710 720 720 730 740 750 760 770 pF1KE9 TRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCLLSQQVR ::.:.::: ::::::::.: :::.:.::.: ::::::::::::::.::::..:::. ::: CCDS58 TRLLTFKAFAQLFILGCSWVLGIFQIGPVAGVMAYLFTIINSLQGAFIFLIHCLLNGQVR 730 740 750 760 770 780 780 790 800 810 pF1KE9 EQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN :.: .: : : ...:. . :. ..:: CCDS58 EEYKRWITGKTKPSSQSQTSRILLSSMPSASKTG 790 800 810 820 >>CCDS12175.1 ADGRE1 gene_id:2015|Hs108|chr19 (886 aa) initn: 1394 init1: 1057 opt: 1249 Z-score: 973.0 bits: 191.1 E(32554): 7.1e-48 Smith-Waterman score: 1728; 38.1% identity (64.0% similar) in 842 aa overlap (19-807:74-884) 10 20 30 40 pF1KE9 MGGRVFLVFLAFCVWLTLPGAETQDSRGCARW---CPQDSSCVNATA- ::.. .: :.. : .::: : .. CCDS12 YATCTNTVDSYYCACKQGFLSSNGQNHFKDPGVRCKDIDECSQSPQPCGPNSSCKNLSGR 50 60 70 80 90 100 50 60 70 80 90 pF1KE9 --CRCNPGFSSFSEIITTPME----TCDDINECATLSKVSCGKFSDCWNTEGSYDCVCSP : : :::: . .: . .: ::::: : :.: : . ::: :. :::.: :. CCDS12 YKCSCLDGFSSPTGNDWVPGKPGNFSCTDINECLT-SSV-CPEHSDCVNSMGSYSCSCQV 110 120 130 140 150 160 100 110 120 130 140 150 pF1KE9 GYEPVSGAKTFKNESENTCQDVDECQQNPRLCKSYGTCVNTLGSYTCQCLPGFK-----F :. .: .: .::.::::: .:: : ..:: ::.:.:.: : :::. . CCDS12 GF--IS-----RN---STCEDVDECA-DPRACPEHATCNNTVGNYSCFCNPGFESSSGHL 170 180 190 200 210 160 170 180 190 200 210 pF1KE9 IPEDPKV-CTDVNECTSGQNPCHSSTHCLNNVGSYQCRCRPGWQPIPGSPNGPNNTV-CE . :. : :..::: . : .. : :. ::: : :.::. : :. : .. : :. CCDS12 SFQGLKASCEDIDECT---EMCPINSTCTNTPGSYFCTCHPGFAPSNGQLNFTDQGVECR 220 230 240 250 260 220 230 240 250 260 pF1KE9 DVDECSSGQHQCDSSTVCFNTVGSYSCRCRPGWKPRHGIPNNQKDT--VCEDMTFSTWTP :.::: . : ...: :..::::: : :..: ..::: :. . :. CCDS12 DIDECRQDPSTCGPNSICTNALGSYSCGCIAGFHPNP--EGSQKDGNFSCQRVLFKCKED 270 280 290 300 310 320 270 280 290 300 310 320 pF1KE9 PPGVHSQTLSRLFDKVQDLGRDYKPGLAN--NTIQSILQALDELLEAPGDLETL------ ..: ... :. : ::. .. :..:...::.. : . .: CCDS12 VIPDNKQ-----IQQCQE-GTAVKPAYVSFCAQINNIFSVLDKVCENKTTVVSLKNTTES 330 340 350 360 370 330 340 350 360 370 pF1KE9 --PRLQQHCVASHLLDGLEDVLRG--LSKNLSNGLLNFSYPAG-------TELSLEVQKQ : :.: . ... . : : . : : .: :.. :: :..... CCDS12 FVPVLKQISTWTKFTKEETSSLATVFLESVESMTLASFWKPSANITPAVRTEY-LDIESK 380 390 400 410 420 430 380 390 400 410 420 pF1KE9 V------DRSVTLR--QNQAVMQLDWNQAQKSGDPGMGKLLAEAPLVLEPEKQMLLHETH : ...::: . :.. . ..: . . . . .: . . . : CCDS12 VINKECSEENVTLDLVAKGDKMKIGCSTIEESESTETTGVAFVSFVGMESVLNERFFKDH 440 450 460 470 480 490 430 440 450 460 470 pF1KE9 QGLLQDGSPILL---SDVISAFLSNNDTQNLSSPVTFTFSHRSVIPRQKV---LCVFWEH :. : : : : : :........ ...:.:. .:. ... :.:: .:: : CCDS12 QAPLTT-SEIKLKMNSRVVGGIMTGEKKDGFSDPIIYTL--ENIQPKQKFERPICVSWST 500 510 520 530 540 550 480 490 500 510 520 530 pF1KE9 GQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHYDVQEEDPVLTVITYMGLSVS .: :.:.. :: . . .: ::: :......::.:: .. : : .:...:. .: CCDS12 DVKG-GRWTSFGCVILEASETYTICSCNQMANLAVIMASGELTM-DFSLYIISHVGIIIS 560 570 580 590 600 610 540 550 560 570 580 590 pF1KE9 LLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFLVAIDQTGHKVLCSIIAGILH :.::.:: :::::..:.: .: :::.: .::.::. :::..: .: .:. :.::::.:: CCDS12 LVCLVLAIATFLLCRSIRNHNTYLHLHLCVCLLLAKTLFLAGIHKTDNKMGCAIIAGFLH 620 630 640 650 660 670 600 610 620 630 640 650 pF1KE9 YLYLATFTWMLLEALYLFLTARNLTVVNYSSINRFMKKL-MFPVGYGVPAVTVAISAASR ::.:: : :::.::. ::: .::: :::: : .: .: : . :::.: ..:.:::. . CCDS12 YLFLACFFWMLVEAVILFLMVRNLKVVNYFS-SRNIKMLHICAFGYGLPMLVVVISASVQ 680 690 700 710 720 730 660 670 680 690 700 710 pF1KE9 PHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVTLWILKNRLSSLNSDVSTLRN :. :: .::::. : ::::.::::::... .: .:. :::::..::::.:..::::.. CCDS12 PQGYGMHNRCWLNTETGFIWSFLGPVCTVIVINSLLLTWTLWILRQRLSSVNAEVSTLKD 740 750 760 770 780 790 720 730 740 750 760 770 pF1KE9 TRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTIINSLQGVFIFLVYCLLSQQVR ::.:.::: ::::::::.: :::.:.::.: ::::::::::::::.::::..:::. ::: CCDS12 TRLLTFKAFAQLFILGCSWVLGIFQIGPVAGVMAYLFTIINSLQGAFIFLIHCLLNGQVR 800 810 820 830 840 850 780 790 800 810 pF1KE9 EQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN :.: .: : : ...:. . :. ..:: CCDS12 EEYKRWITGKTKPSSQSQTSRILLSSMPSASKTG 860 870 880 >>CCDS58646.1 ADGRE1 gene_id:2015|Hs108|chr19 (745 aa) initn: 1383 init1: 1057 opt: 1229 Z-score: 958.4 bits: 188.1 E(32554): 4.6e-47 Smith-Waterman score: 1519; 38.0% identity (64.3% similar) in 742 aa overlap (111-807:29-743) 90 100 110 120 130 140 pF1KE9 KFSDCWNTEGSYDCVCSPGYEPVSGAKTFKNESENTCQDVDECQQNPRLCKSYGTCVNTL : . :.:.: :: .:.::.::. CCDS58 MRGFNLLLFWGCCVMHSWEGHIRPTRKPNTKGNNCRD-------STLCPAYATCTNTV 10 20 30 40 50 150 160 170 180 190 pF1KE9 GSYTCQCLPGF-------KFIPEDPKV-CTDVNECTSGQNPCHSSTHCLNNVGSYQCRCR :: : : :: .: .:: : : :..::: . : .. : :. ::: : :. CCDS58 DSYYCACKQGFLSSNGQNHF--KDPGVRCKDIDECT---EMCPINSTCTNTPGSYFCTCH 60 70 80 90 100 200 210 220 230 240 250 pF1KE9 PGWQPIPGSPNGPNNTV-CEDVDECSSGQHQCDSSTVCFNTVGSYSCRCRPGWKPRHGIP ::. : :. : .. : :.:.::: . : ...: :..::::: : :..: CCDS58 PGFAPSNGQLNFTDQGVECRDIDECRQDPSTCGPNSICTNALGSYSCGCIAGFHPNP--E 110 120 130 140 150 160 260 270 280 290 300 pF1KE9 NNQKDT--VCEDMTFSTWTPPPGVHSQTLSRLFDKVQDLGRDYKPGLAN--NTIQSILQA ..::: :. . :. ..: ... :. : ::. .. :..:... CCDS58 GSQKDGNFSCQRVLFKCKEDVIPDNKQ-----IQQCQE-GTAVKPAYVSFCAQINNIFSV 170 180 190 200 210 310 320 330 340 350 pF1KE9 LDELLEAPGDLETL--------PRLQQHCVASHLLDGLEDVLRG--LSKNLSNGLLNFSY ::.. : . .: : :.: . ... . : : . : : .: CCDS58 LDKVCENKTTVVSLKNTTESFVPVLKQISTWTKFTKEETSSLATVFLESVESMTLASFWK 220 230 240 250 260 270 360 370 380 390 400 pF1KE9 PAG-------TELSLEVQKQV------DRSVTLR--QNQAVMQLDWNQAQKSGDPGMGKL :.. :: :.....: ...::: . :.. . ..: . . CCDS58 PSANITPAVRTEY-LDIESKVINKECSEENVTLDLVAKGDKMKIGCSTIEESESTETTGV 280 290 300 310 320 330 410 420 430 440 450 pF1KE9 LAEAPLVLEPEKQMLLHETHQGLLQDGSPILL---SDVISAFLSNNDTQNLSSPVTFTFS . . .: . . . ::. : : : : : :........ ...:.:. .:. CCDS58 AFVSFVGMESVLNERFFKDHQAPLTT-SEIKLKMNSRVVGGIMTGEKKDGFSDPIIYTL- 340 350 360 370 380 390 460 470 480 490 500 510 pF1KE9 HRSVIPRQKV---LCVFWEHGQNGCGHWATTGCSTIGTRDTSTICRCTHLSSFAVLMAHY ... :.:: .:: : .: :.:.. :: . . .: ::: :......::.:: CCDS58 -ENIQPKQKFERPICVSWSTDVKG-GRWTSFGCVILEASETYTICSCNQMANLAVIMASG 400 410 420 430 440 450 520 530 540 550 560 570 pF1KE9 DVQEEDPVLTVITYMGLSVSLLCLLLAALTFLLCKAIQNTSTSLHLQLSLCLFLAHLLFL .. : : .:...:. .::.::.:: :::::..:.: .: :::.: .::.::. ::: CCDS58 ELTM-DFSLYIISHVGIIISLVCLVLAIATFLLCRSIRNHNTYLHLHLCVCLLLAKTLFL 460 470 480 490 500 510 580 590 600 610 620 630 pF1KE9 VAIDQTGHKVLCSIIAGILHYLYLATFTWMLLEALYLFLTARNLTVVNYSSINRFMKKL- ..: .: .:. :.::::.::::.:: : :::.::. ::: .::: :::: : .: .: : CCDS58 AGIHKTDNKMGCAIIAGFLHYLFLACFFWMLVEAVILFLMVRNLKVVNYFS-SRNIKMLH 520 530 540 550 560 570 640 650 660 670 680 690 pF1KE9 MFPVGYGVPAVTVAISAASRPHLYGTPSRCWLQPEKGFIWGFLGPVCAIFSVNLVLFLVT . :::.: ..:.:::. .:. :: .::::. : ::::.::::::... .: .:. : CCDS58 ICAFGYGLPMLVVVISASVQPQGYGMHNRCWLNTETGFIWSFLGPVCTVIVINSLLLTWT 580 590 600 610 620 630 700 710 720 730 740 750 pF1KE9 LWILKNRLSSLNSDVSTLRNTRMLAFKATAQLFILGCTWCLGILQVGPAARVMAYLFTII ::::..::::.:..::::..::.:.::: ::::::::.: :::.:.::.: ::::::::: CCDS58 LWILRQRLSSVNAEVSTLKDTRLLTFKAFAQLFILGCSWVLGIFQIGPVAGVMAYLFTII 640 650 660 670 680 690 760 770 780 790 800 810 pF1KE9 NSLQGVFIFLVYCLLSQQVREQYGKWSKGIRKLKTESEMHTLSSSAKADTSKPSTVN :::::.::::..:::. ::::.: .: : : ...:. . :. ..:: CCDS58 NSLQGAFIFLIHCLLNGQVREEYKRWITGKTKPSSQSQTSRILLSSMPSASKTG 700 710 720 730 740 812 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 08:07:43 2016 done: Sun Nov 6 08:07:44 2016 Total Scan time: 2.990 Total Display time: 0.240 Function used was FASTA [36.3.4 Apr, 2011]