FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3772, 1606 aa 1>>>pF1KE3772 1606 - 1606 aa - 1606 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3415+/-0.00128; mu= 18.5334+/- 0.076 mean_var=107.3417+/-21.200, 0's: 0 Z-trim(102.9): 154 B-trim: 26 in 1/49 Lambda= 0.123791 statistics sampled from 7010 (7176) to 7010 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.565), E-opt: 0.2 (0.22), width: 16 Scan time: 3.970 The best scores are: opt bits E(32554) CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606) 10699 1923.4 0 CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659) 4126 749.5 2e-215 CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 670) 675 132.9 3.4e-30 CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 ( 690) 675 132.9 3.5e-30 CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 ( 574) 651 128.6 5.9e-29 CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 ( 596) 651 128.6 6e-29 CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 ( 652) 651 128.6 6.5e-29 CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277) 651 128.8 1.1e-28 CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 463) 644 127.3 1.2e-28 CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 495) 644 127.3 1.2e-28 CCDS35315.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 516) 644 127.3 1.3e-28 CCDS55429.1 ARHGEF9 gene_id:23229|Hs108|chrX ( 414) 637 126.0 2.6e-28 CCDS73553.1 SPATA13 gene_id:221178|Hs108|chr13 ( 512) 607 120.7 1.2e-26 CCDS6331.1 DEPTOR gene_id:64798|Hs108|chr8 ( 409) 523 105.6 3.4e-22 CCDS4829.1 FGD2 gene_id:221472|Hs108|chr6 ( 655) 365 77.6 1.5e-13 CCDS81679.1 FGD4 gene_id:121512|Hs108|chr12 ( 673) 360 76.7 2.9e-13 CCDS8727.1 FGD4 gene_id:121512|Hs108|chr12 ( 766) 360 76.7 3.2e-13 CCDS76544.1 FGD4 gene_id:121512|Hs108|chr12 ( 851) 360 76.7 3.5e-13 CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 363 77.4 3.6e-13 CCDS76545.1 FGD4 gene_id:121512|Hs108|chr12 ( 878) 360 76.7 3.6e-13 CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 354 75.8 9.8e-13 CCDS8221.1 ARHGEF17 gene_id:9828|Hs108|chr11 (2063) 353 75.8 1.7e-12 CCDS56338.1 ARHGEF38 gene_id:54848|Hs108|chr4 ( 777) 344 73.9 2.4e-12 CCDS6979.1 VAV2 gene_id:7410|Hs108|chr9 ( 839) 339 73.0 4.7e-12 CCDS48053.1 VAV2 gene_id:7410|Hs108|chr9 ( 878) 339 73.0 4.9e-12 CCDS9521.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 646) 327 70.8 1.7e-11 CCDS45069.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 753) 327 70.8 1.9e-11 CCDS32009.1 ARHGEF7 gene_id:8874|Hs108|chr13 ( 782) 327 70.8 2e-11 CCDS69619.1 FGD3 gene_id:89846|Hs108|chr9 ( 724) 323 70.1 3e-11 CCDS43849.1 FGD3 gene_id:89846|Hs108|chr9 ( 725) 323 70.1 3e-11 >>CCDS6201.1 PREX2 gene_id:80243|Hs108|chr8 (1606 aa) initn: 10699 init1: 10699 opt: 10699 Z-score: 10325.4 bits: 1923.4 E(32554): 0 Smith-Waterman score: 10699; 100.0% identity (100.0% similar) in 1606 aa overlap (1-1606:1-1606) 10 20 30 40 50 60 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSELQKTERDYVGTLEFLVSAFLHRMNQCAASK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MSEDSRGDSRAESAKDLEKQLRLRVCVLSELQKTERDYVGTLEFLVSAFLHRMNQCAASK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 VDKNVTEETVKMLFSNIEDILAVHKEFLKVVEECLHPEPNAQQEVGTCFLHFKDKFRIYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 VDKNVTEETVKMLFSNIEDILAVHKEFLKVVEECLHPEPNAQQEVGTCFLHFKDKFRIYD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 EYCSNHEKAQKLLLELNKIRTIRTFLLNCMLLGGRKNTDVPLEGYLVTPIQRICKYPLIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 EYCSNHEKAQKLLLELNKIRTIRTFLLNCMLLGGRKNTDVPLEGYLVTPIQRICKYPLIL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 KELLKRTPRKHSDYAAVMEALQAMKAVCSNINEAKRQMEKLEVLEEWQSHIEGWEGSNIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KELLKRTPRKHSDYAAVMEALQAMKAVCSNINEAKRQMEKLEVLEEWQSHIEGWEGSNIT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 DTCTEMLMCGVLLKISSGNIQERVFFLFDNLLVYCKRKHRRLKNSKASTDGHRYLFRGRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 DTCTEMLMCGVLLKISSGNIQERVFFLFDNLLVYCKRKHRRLKNSKASTDGHRYLFRGRI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 NTEVMEVENVDDGTADFHSSGHIVVNGWKIHNTAKNKWFVCMAKTPEEKHEWFEAILKER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 NTEVMEVENVDDGTADFHSSGHIVVNGWKIHNTAKNKWFVCMAKTPEEKHEWFEAILKER 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 ERRKGLKLGMEQDTWVMISEQGEKLYKMMCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ERRKGLKLGMEQDTWVMISEQGEKLYKMMCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 EIGEIHRPEEGVHLGQALLENGIIHHVTDKHQFKPEQMLYRFRYDDGTFYPRNEMQDVIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 EIGEIHRPEEGVHLGQALLENGIIHHVTDKHQFKPEQMLYRFRYDDGTFYPRNEMQDVIS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 KGVRLYCRLHSLFTPVIRDKDYHLRTYKSVVMANKLIDWLIAQGDCRTREEAMIFGVGLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KGVRLYCRLHSLFTPVIRDKDYHLRTYKSVVMANKLIDWLIAQGDCRTREEAMIFGVGLC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 DNGFMHHVLEKSEFKDEPLLFRFFSDEEMEGSNMKHRLMKHDLKVVENVIAKSLLIKSNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 DNGFMHHVLEKSEFKDEPLLFRFFSDEEMEGSNMKHRLMKHDLKVVENVIAKSLLIKSNE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 GSYGFGLEDKNKVPIIKLVEKGSNAEMAGMEVGKKIFAINGDLVFMRPFNEVDCFLKSCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 GSYGFGLEDKNKVPIIKLVEKGSNAEMAGMEVGKKIFAINGDLVFMRPFNEVDCFLKSCL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 NSRKPLRVLVSTKPRETVKIPDSADGLGFQIRGFGPSVVHAVGRGTVAAAAGLHPGQCII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 NSRKPLRVLVSTKPRETVKIPDSADGLGFQIRGFGPSVVHAVGRGTVAAAAGLHPGQCII 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 KVNGINVSKETHASVIAHVTACRKYRRPTKQDSIQWVYNSIESAQEDLQKSHSKPPGDEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 KVNGINVSKETHASVIAHVTACRKYRRPTKQDSIQWVYNSIESAQEDLQKSHSKPPGDEA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 GDAFDCKVEEVIDKFNTMAIIDGKKEHVSLTVDNVHLEYGVVYEYDSTAGIKCNVVEKMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 GDAFDCKVEEVIDKFNTMAIIDGKKEHVSLTVDNVHLEYGVVYEYDSTAGIKCNVVEKMI 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 EPKGFFSLTAKILEALAKSDEHFVQNCTSLNSLNEVIPTDLQSKFSALCSERIEHLCQRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 EPKGFFSLTAKILEALAKSDEHFVQNCTSLNSLNEVIPTDLQSKFSALCSERIEHLCQRI 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 SSYKKFSRVLKNRAWPTFKQAKSKISPLHSSDFCPTNCHVNVMEVSYPKTSTSLGSAFGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 SSYKKFSRVLKNRAWPTFKQAKSKISPLHSSDFCPTNCHVNVMEVSYPKTSTSLGSAFGV 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 QLDSRKHNSHDKENKSSEQGKLSPMVYIQHTITTMAAPSGLSLGQQDGHGLRYLLKEEDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 QLDSRKHNSHDKENKSSEQGKLSPMVYIQHTITTMAAPSGLSLGQQDGHGLRYLLKEEDL 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 ETQDIYQKLLGKLQTALKEVEMCVCQIDDLLSSITYSPKLERKTSEGIIPTDSDNEKGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 ETQDIYQKLLGKLQTALKEVEMCVCQIDDLLSSITYSPKLERKTSEGIIPTDSDNEKGER 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 NSKRVCFNVAGDEQEDSGHDTISNRDSYSDCNSNRNSIASFTSICSSQCSSYFHSDEMDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 NSKRVCFNVAGDEQEDSGHDTISNRDSYSDCNSNRNSIASFTSICSSQCSSYFHSDEMDS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE3 GDELPLSVRISHDKQDKIHSCLEHLFSQVDSITNLLKGQAVVRAFDQTKYLTPGRGLQEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 GDELPLSVRISHDKQDKIHSCLEHLFSQVDSITNLLKGQAVVRAFDQTKYLTPGRGLQEF 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE3 QQEMEPKLSCPKRLRLHIKQDPWNLPSSVRTLAQNIRKFVEEVKCRLLLALLEYSDSETQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 QQEMEPKLSCPKRLRLHIKQDPWNLPSSVRTLAQNIRKFVEEVKCRLLLALLEYSDSETQ 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE3 LRRDMVFCQTLVATVCAFSEQLMAALNQMFDNSKENEMETWEASRRWLDQIANAGVLFHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 LRRDMVFCQTLVATVCAFSEQLMAALNQMFDNSKENEMETWEASRRWLDQIANAGVLFHF 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE3 QSLLSPNLTDEQAMLEDTLVALFDLEKVSFYFKPSEEEPLVANVPLTYQAEGSRQALKVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 QSLLSPNLTDEQAMLEDTLVALFDLEKVSFYFKPSEEEPLVANVPLTYQAEGSRQALKVY 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE3 FYIDSYHFEQLPQRLKNGGGFKIHPVLFAQALESMEGYYYRDNVSVEEFQAQINAASLEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 FYIDSYHFEQLPQRLKNGGGFKIHPVLFAQALESMEGYYYRDNVSVEEFQAQINAASLEK 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE3 VKQYNQKLRAFYLDKSNSPPNSTSKAAYVDKLMRPLNALDELYRLVASFIRSKRTAACAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 VKQYNQKLRAFYLDKSNSPPNSTSKAAYVDKLMRPLNALDELYRLVASFIRSKRTAACAN 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE3 TACSASGVGLLSVSSELCNRLGACHIIMCSSGVHRCTLSVTLEQAIILARSHGLPPRYIM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 TACSASGVGLLSVSSELCNRLGACHIIMCSSGVHRCTLSVTLEQAIILARSHGLPPRYIM 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 pF1KE3 QATDVMRKQGARVQNTAKNLGVRDRTPQSAPRLYKLCEPPPPAGEE :::::::::::::::::::::::::::::::::::::::::::::: CCDS62 QATDVMRKQGARVQNTAKNLGVRDRTPQSAPRLYKLCEPPPPAGEE 1570 1580 1590 1600 >>CCDS13410.1 PREX1 gene_id:57580|Hs108|chr20 (1659 aa) initn: 5028 init1: 1608 opt: 4126 Z-score: 3980.9 bits: 749.5 E(32554): 2e-215 Smith-Waterman score: 6131; 57.4% identity (80.8% similar) in 1640 aa overlap (5-1600:31-1654) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSELQKT : : . .:.. :.:::::.:::.:. : CCDS13 MEAPSGSEPGGDGAGDCAHPDPRAPGAAAPSSGPGPCAAARESERQLRLRLCVLNEILGT 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE3 ERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVVEEC ::::::::.:: ::::::. : .:..:.:..:::.::.::::::::: :::.:: ..: : CCDS13 ERDYVGTLRFLQSAFLHRIRQNVADSVEKGLTEENVKVLFSNIEDILEVHKDFLAALEYC 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE3 LHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCMLLGG :::::..:.:.:. ::.::::: .:.::::::::: .::.::::: :.:.:::.:::::: CCDS13 LHPEPQSQHELGNVFLKFKDKFCVYEEYCSNHEKALRLLVELNKIPTVRAFLLSCMLLGG 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE3 RKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNINEA ::.::.::::::..::::::::::.:::: :::: :: :. ::. ::::::.:::::::. CCDS13 RKTTDIPLEGYLLSPIQRICKYPLLLKELAKRTPGKHPDHPAVQSALQAMKTVCSNINET 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE3 KRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISSGNIQERVFFLFDNLLVY ::::::::.::. :::::::::::.:: ::..:. :.:::::.::::::.:::::::::: CCDS13 KRQMEKLEALEQLQSHIEGWEGSNLTDICTQLLLQGTLLKISAGNIQERAFFLFDNLLVY 250 260 270 280 290 300 280 290 300 310 320 pF1KE3 CKRKHRRLKNSKAST------DGHRYLFRGRINTEVMEVENVDDGTADFHSSGHIVVNGW :::: : . .:: :: .: :.:::::::::::::::.:::::.::.:. :.::: CCDS13 CKRKSR-VTGSKKSTKRTKSINGSLYIFRGRINTEVMEVENVEDGTADYHSNGYTVTNGW 310 320 330 340 350 330 340 350 360 370 380 pF1KE3 KIHNTAKNKWFVCMAKTPEEKHEWFEAILKERERRKGLKLGMEQDTWVMISEQGEKLYKM ::::::::::::::::: :::..:..::..:::.:..::::::.:..:::.:.:::::.: CCDS13 KIHNTAKNKWFVCMAKTAEEKQKWLDAIIREREQRESLKLGMERDAYVMIAEKGEKLYHM 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE3 MC-RQGNLIKDRKRKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHV : .. ::::::.:::.: ::::::.:::.:::::::: . ::::.:::::::::::::: CCDS13 MMNKKVNLIKDRRRKLSTVPKCFLGNEFVAWLLEIGEISKTEEGVNLGQALLENGIIHHV 420 430 440 450 460 470 450 460 470 480 490 500 pF1KE3 TDKHQFKPEQMLYRFRYDDGTFYPRNEMQDVISKGVRLYCRLHSLFTPVIRDKDYHLRTY .:::::: ::..:::::::::. :.:..:..:::::::::::::.::::.:.::::.:: CCDS13 SDKHQFKNEQVMYRFRYDDGTYKARSELEDIMSKGVRLYCRLHSLYTPVIKDRDYHLKTY 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE3 KSVVMANKLIDWLIAQGDCRTREEAMIFGVGLCDNGFMHHVLEKSEFKDEPLLFRFFSDE :::. ..::.:::.:::::.:::::. .:::::.:::::::::::::.:: ::: .:: CCDS13 KSVLPGSKLVDWLLAQGDCQTREEAVALGVGLCNNGFMHHVLEKSEFRDESQYFRFHADE 540 550 560 570 580 590 570 580 590 600 610 620 pF1KE3 EMEGSNMKHRLMKHDLKVVENVIAKSLLIKSNEGSYGFGLEDKNKVPIIKLVEKGSNAEM ::::.. :.. ...:.:.:::..:: ::: .: .::: .:.:::. ..: :..:: ::. CCDS13 EMEGTSSKNKQLRNDFKLVENILAKRLLILPQEEDYGFDIEEKNKAVVVKSVQRGSLAEV 600 610 620 630 640 650 630 640 650 660 670 680 pF1KE3 AGMEVGKKIFAINGDLVFMRPFNEVDCFLKSCLNSRKPLRVLVSTKPRETVKIPDSADGL ::..::.::..:: ::::.:::.::. .:.. . ::.:::.::.:: .: .::::. : : CCDS13 AGLQVGRKIYSINEDLVFLRPFSEVESILNQSFCSRRPLRLLVATKAKEIIKIPDQPDTL 660 670 680 690 700 710 690 700 710 720 730 740 pF1KE3 GFQIRGFGPSVVHAVGRGTVAAAAGLHPGQCIIKVNGINVSKETHASVIAHVTACRKYRR ::::: .: :.:::::. : :::: ::::.:::: :: .. :. : : :. :: CCDS13 CFQIRGAAPPYVYAVGRGSEAMAAGLCAGQCILKVNGSNVMNDGAPEVLEHFQAFRS-RR 720 730 740 750 760 770 750 760 770 780 790 800 pF1KE3 PTKQDSIQWVYNSIESAQE---DLQKSHSKPPGDEAGDAFDCKVEEVIDKFNTMAIIDGK ::.:.. :.::: . . : : :..: . . . ... . CCDS13 EEALGLYQWIYHTHEDAQEARASQEASTEDPSGEQAQEEDQADSAFPLLSLGPRLSLCED 780 790 800 810 820 830 810 820 830 840 850 860 pF1KE3 KEHVSLTVDNVHLEYGVVYEYDSTAGIKCNVVEKMIEPKGFFSLTAKILEALAKSDEHFV . :.:::::::::.:::::: ::::..:.:.::..::.: :.::::::::.: .: :: CCDS13 SPMVTLTVDNVHLEHGVVYEYVSTAGVRCHVLEKIVEPRGCFGLTAKILEAFAANDSVFV 840 850 860 870 880 890 870 880 890 900 910 920 pF1KE3 QNCTSLNSLNEVIPTDLQSKFSALCSERIEHLCQRISSYKKFSRVLKNRAWPTFKQAKSK .:: : .:. .: : . .: .:. ..: . :::. :..:. ::.:. : :::: . CCDS13 ENCRRLMALSSAIVTMPHFEFRNICDTKLESIGQRIACYQEFAAQLKSRVSPPFKQAPLE 900 910 920 930 940 950 930 940 950 960 970 980 pF1KE3 ISPLHSSDFCPTNCHVNVMEVSYPKTSTSLGSAFGVQLDSRKHNSHDKENKSSEQGKLSP :: . ::::::::.:.::::::::. :.: .:.... .:: . . :::.:.: CCDS13 PHPLCGLDFCPTNCHINLMEVSYPKTTPSVGRSFSIRF-GRKPSLIGLD---PEQGHLNP 960 970 980 990 1000 1010 990 1000 1010 1020 pF1KE3 MVYIQHTITTMAAPS--------------GL----------SLGQQDGHGLRYLLKEEDL : : :: :::::::: :: .:::.: .:: .:::.:: CCDS13 MSYTQHCITTMAAPSWKCLPAAEGDPQGQGLHDGSFGPASGTLGQED-RGLSFLLKQEDR 1020 1030 1040 1050 1060 1070 1030 1040 1050 1060 1070 pF1KE3 ETQDIYQKLLGKLQTALKEVEMCVCQIDDLLSSITYSPK--------LERKTSEGIIPTD : :: : .:. ::..::::... : ::. :::.:: . :. .: .. . CCDS13 EIQDAYLQLFTKLDVALKEMKQYVTQINRLLSTITEPTSGGSCDASLAEEASSLPLVSEE 1080 1090 1100 1110 1120 1130 1080 1090 1100 1110 1120 1130 pF1KE3 SDNEKGERNS-KRVCFNVAGDEQEDSGHDTISNRDSYSDCNSNRNSIASFTSICSSQCSS :. ....... :.:::.:: ..::::::::.: :::::.:::::.:. :.::. :. :: CCDS13 SEMDRSDHGGIKKVCFKVAEEDQEDSGHDTMSYRDSYSECNSNRDSVLSYTSVRSN--SS 1140 1150 1160 1170 1180 1190 1140 1150 1160 1170 1180 1190 pF1KE3 YFHSDEMDSGDELPLSVRISHDKQDKIHSCLEHLFSQVDSITNLLKGQAVVRAFDQTKYL :. :::: :::::: ..:: :::::.:.::::::.:::::. :::: .. :::..::.. CCDS13 YLGSDEMGSGDELPCDMRIPSDKQDKLHGCLEHLFNQVDSINALLKGPVMSRAFEETKHF 1200 1210 1220 1230 1240 1250 1200 1210 1220 1230 1240 1250 pF1KE3 TPGRGLQEFQQEMEPKLSCPKRLRLHIKQDPWNLPSSVRTLAQNIRKFVEEVKCRLLLAL ...::::.:. : . . ... :..::::::.:..::..::...::. : .::::: CCDS13 PMNHSLQEFKQKEECTIRGRSLIQISIQEDPWNLPNSIKTLVDNIQRYVEDGKNQLLLAL 1260 1270 1280 1290 1300 1310 1260 1270 1280 1290 1300 1310 pF1KE3 LEYSDSETQLRRDMVFCQTLVATVCAFSEQLMAALNQMFDNSKENEMETWEASRRWLDQI :. .:.: ::::: .:::.:::.::.::.::.:::. ..:. : : . .:::.::.:. CCDS13 LKCTDTELQLRRDAIFCQALVAAVCTFSKQLLAALGYRYNNNGEYEESSRDASRKWLEQV 1320 1330 1340 1350 1360 1370 1320 1330 1340 1350 1360 1370 pF1KE3 ANAGVLFHFQSLLSP-NLTDEQAMLEDTLVALFDLEKVSFYFKPSEEEPLVANVPLTYQA : .:::.: :::::: .. .:..:::: :.: .:..:.: :: .:. :::. . :. CCDS13 AATGVLLHCQSLLSPATVKEERTMLEDIWVTLSELDNVTFSFKQLDEN-YVANTNVFYHI 1380 1390 1400 1410 1420 1430 1380 1390 1400 1410 1420 1430 pF1KE3 EGSRQALKVYFYIDSYHFEQLPQRLKNGGGFKIHPVLFAQALESMEGYYYRDNVSVEEFQ ::::::::: ::.::::: .::.::..:.....: .::...::..:: . ..:..: CCDS13 EGSRQALKVIFYLDSYHFSKLPSRLEGGASLRLHTALFTKVLENVEGLPSPGSQAAEDLQ 1440 1450 1460 1470 1480 1490 1440 1450 1460 1470 1480 1490 pF1KE3 AQINAASLEKVKQYNQKLRAFYLDKSNSPPNSTSKAAYVDKLMRPLNALDELYRLVASFI .::: :::::.:: .:::::::..:: : .... :. .:.:.::.:::::: ::. ::. CCDS13 QDINAQSLEKVQQYYRKLRAFYLERSNLPTDASTTAVKIDQLIRPINALDELCRLMKSFV 1500 1510 1520 1530 1540 1550 1500 1510 1520 1530 1540 1550 pF1KE3 RSKRTAACANTACSASGVGLLSVSSELCNRLGACHIIMCSSGVHRCTLSVTLEQAIILAR . : :: .. :.::. .::::: :::::...::..:..: ::::.:::: :::: CCDS13 HPKPGAA------GSVGAGLIPISSELCYRLGACQMVMCGTGMQRSTLSVSLEQAAILAR 1560 1570 1580 1590 1600 1560 1570 1580 1590 1600 pF1KE3 SHGLPPRYIMQATDVMRKQGARVQNTAKNLGVRDRTPQSAPRLYKLCEPPPPAGEE :::: :. ::::::.::::: ::. :::: :.:. ::.:::::.::.:: CCDS13 SHGLLPKCIMQATDIMRKQGPRVEILAKNLRVKDQMPQGAPRLYRLCQPPVDGDL 1610 1620 1630 1640 1650 >>CCDS42754.1 ARHGEF4 gene_id:50649|Hs108|chr2 (670 aa) initn: 495 init1: 259 opt: 675 Z-score: 655.6 bits: 132.9 E(32554): 3.4e-30 Smith-Waterman score: 766; 35.0% identity (64.2% similar) in 411 aa overlap (2-408:270-640) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSEL .:: : ..:.:.:: ..:. :..:. CCDS42 EGWFPASFVRLRVNQDEPADDDAPLAGNSGAED--GGAEAQSSKD-----QMRTNVINEI 240 250 260 270 280 290 40 50 60 70 80 90 pF1KE3 QKTERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVV .:::::. :. . .... :: ...: .:: .. .:.::::: .: :.:.. CCDS42 LSTERDYIKHLRDICEGYVR---QCR-KRADM-FSEEQLRTIFGNIEDIYRCQKAFVKAL 300 310 320 330 340 100 110 120 130 140 150 pF1KE3 EECLHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCML :. .. : .:.:.:::. . :.::.:::.:: .: : .:.:. :. : : CCDS42 EQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRL 350 360 370 380 390 400 160 170 180 190 200 210 pF1KE3 LGGRKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNI : .: :. :.:.:.::.:.:::::: : :::: : .: :. : ::.::: : . : CCDS42 L--QKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLI 410 420 430 440 450 460 220 230 240 250 260 pF1KE3 NEAKRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISSGNI--QERVFFLFD :: ::..:... . .::: :: ::: .. .:... : : .... . :.:.::::: CCDS42 NERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFD 470 480 490 500 510 520 270 280 290 300 310 320 pF1KE3 NLLVYCKRKHRRLKNSKASTDGHRYLFRGRINTEVMEVENVDDGTA-DFHSSGHIVVNGW . :.:::. : : : .::.. . .:: ...:: :.: : . :.. CCDS42 HQLIYCKKDLLR-------RDVLYY--KGRLDMDGLEVVDLEDGKDRDLHVS---IKNAF 530 540 550 560 570 330 340 350 360 370 380 pF1KE3 KIHNTAK-NKWFVCMAKTPEEKHEWFEAILKERERRKGLKLGMEQDTWVMISEQGEKLYK ..: : .. ..: : ::.:..:..:. .::: .. ..:.: :.: CCDS42 RLHRGATGDSHLLCTRK-PEQKQRWLKAFARERE-----QVQLDQETGFSITE------- 580 590 600 610 620 390 400 410 420 430 440 pF1KE3 MMCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHV . :. ... :...: :: CCDS42 -LQRKQAMLNASKQQVTGKPKGRRTAAPPPRLPGPYPADIIPFSEPQSQAS 630 640 650 660 670 >>CCDS2165.1 ARHGEF4 gene_id:50649|Hs108|chr2 (690 aa) initn: 495 init1: 259 opt: 675 Z-score: 655.4 bits: 132.9 E(32554): 3.5e-30 Smith-Waterman score: 768; 34.4% identity (62.7% similar) in 418 aa overlap (2-411:270-648) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSEL .:: : ..:.:.:: ..:. :..:. CCDS21 EGWFPASFVRLRVNQDEPADDDAPLAGNSGAED--GGAEAQSSKD-----QMRTNVINEI 240 250 260 270 280 290 40 50 60 70 80 90 pF1KE3 QKTERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVV .:::::. :. . .... :: : .:: .. .:.::::: .: :.:.. CCDS21 LSTERDYIKHLRDICEGYVR---QC--RKRADMFSEEQLRTIFGNIEDIYRCQKAFVKAL 300 310 320 330 340 100 110 120 130 140 150 pF1KE3 EECLHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCML :. .. : .:.:.:::. . :.::.:::.:: .: : .:.:. :. : : CCDS21 EQRFNRERPHLSELGACFLEHQADFQIYSEYCNNHPNACVELSRLTKLSKYVYFFEACRL 350 360 370 380 390 400 160 170 180 190 200 210 pF1KE3 LGGRKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNI : .: :. :.:.:.::.:.:::::: : :::: : .: :. : ::.::: : . : CCDS21 L--QKMIDISLDGFLLTPVQKICKYPLQLAELLKYTHPQHRDFKDVEAALHAMKNVAQLI 410 420 430 440 450 460 220 230 240 250 260 pF1KE3 NEAKRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISSGNI--QERVFFLFD :: ::..:... . .::: :: ::: .. .:... : : .... . :.:.::::: CCDS21 NERKRRLENIDKIAQWQSSIEDWEGEDLLVRSSELIYSGELTRVTQPQAKSQQRMFFLFD 470 480 490 500 510 520 270 280 290 300 310 320 pF1KE3 NLLVYCKRKHRRLKNSKASTDGHRYLFRGRINTEVMEVENVDDGTA-DFHSSGHIVVNGW . :.:::. : : : .::.. . .:: ...:: :.: : . :.. CCDS21 HQLIYCKKDLLR-------RDVLYY--KGRLDMDGLEVVDLEDGKDRDLHVS---IKNAF 530 540 550 560 570 330 340 350 360 370 380 pF1KE3 KIHNTAKNKWFVCMAKTPEEKHEWFEAILKERERRKGLKLGMEQDTWVMISEQGEKLYKM ..: : . . .. ::.:..:..:. .::: .. ..:.: :.: CCDS21 RLHRGATGDSHLLCTRKPEQKQRWLKAFARERE-----QVQLDQETGFSITE-------- 580 590 600 610 620 390 400 410 420 430 440 pF1KE3 MCRQGNLIKDRKRKLTTFPK-----CFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGI . :. ... :...: :: :.: CCDS21 LQRKQAMLNASKQQVTGKPKAVGRPCYLTRQKHPALPSNRPQQQVLVLAEPRRKPSTFWH 630 640 650 660 670 680 >>CCDS66517.1 SPATA13 gene_id:221178|Hs108|chr13 (574 aa) initn: 570 init1: 295 opt: 651 Z-score: 633.4 bits: 128.6 E(32554): 5.9e-29 Smith-Waterman score: 719; 34.4% identity (61.1% similar) in 401 aa overlap (2-399:141-516) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSEL ::.. .. . :.. ..:. :. :. CCDS66 SEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCENKQQMRTNVIREI 120 130 140 150 160 170 40 50 60 70 80 90 pF1KE3 QKTERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVV . ::: :. :. . .... :: : : . .:.::::: ...::: . CCDS66 MDTERVYIKHLRDICEGYIR---QC--RKHTGMFTVAQLATIFGNIEDIYKFQRKFLKDL 180 190 200 210 220 100 110 120 130 140 150 pF1KE3 EECLHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCML :. . : .:.:.:::. .. : ::.:::.:: : : .: : : :. : : CCDS66 EKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRHFFEACRL 230 240 250 260 270 280 160 170 180 190 200 210 pF1KE3 LGGRKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNI : .. :. ..:.:.::.:.:::::: : :::: : ..:.::. . : .::: : : CCDS66 L--QQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKNVACLI 290 300 310 320 330 340 220 230 240 250 260 270 pF1KE3 NEAKRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISS-GNIQERVFFLFDN :: ::..:... . .:: : :::: .: : .:.. : : ::.. :. :.:.:::::. CCDS66 NERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQGKSQQRTFFLFDH 350 360 370 380 390 400 280 290 300 310 320 pF1KE3 LLVYCKRKHRRLKNSKASTDGHRYLFRGRINTEVMEVENVDDGT-ADFHSSGHIVVNGWK :: ::. : : : .::.. . ::. .. :: : . : : :..: CCDS66 QLVSCKKDLLR-------RDMLYY--KGRLDMDEMELVDLGDGRDKDCNLS---VKNAFK 410 420 430 440 450 330 340 350 360 370 380 pF1KE3 IHNTAKNKWFVCMAKTPEEKHEWFEAILKERER-RKGLKLGMEQDTWVMISEQGEKLYKM . . . .. .. :: :.: .:..: ::.: .. ..::: :::. .:: . CCDS66 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGME------ISENQKKLAML 460 470 480 490 500 390 400 410 420 430 440 pF1KE3 MCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHVT .... :.. CCDS66 NAQKAGHGKSKGYNRCPVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHT 510 520 530 540 550 560 >>CCDS66518.1 SPATA13 gene_id:221178|Hs108|chr13 (596 aa) initn: 570 init1: 295 opt: 651 Z-score: 633.1 bits: 128.6 E(32554): 6e-29 Smith-Waterman score: 719; 34.4% identity (61.1% similar) in 401 aa overlap (2-399:163-538) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSEL ::.. .. . :.. ..:. :. :. CCDS66 SEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCENKQQMRTNVIREI 140 150 160 170 180 190 40 50 60 70 80 90 pF1KE3 QKTERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVV . ::: :. :. . .... :: : : . .:.::::: ...::: . CCDS66 MDTERVYIKHLRDICEGYIR---QC--RKHTGMFTVAQLATIFGNIEDIYKFQRKFLKDL 200 210 220 230 240 100 110 120 130 140 150 pF1KE3 EECLHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCML :. . : .:.:.:::. .. : ::.:::.:: : : .: : : :. : : CCDS66 EKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRHFFEACRL 250 260 270 280 290 300 160 170 180 190 200 210 pF1KE3 LGGRKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNI : .. :. ..:.:.::.:.:::::: : :::: : ..:.::. . : .::: : : CCDS66 L--QQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKNVACLI 310 320 330 340 350 360 220 230 240 250 260 270 pF1KE3 NEAKRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISS-GNIQERVFFLFDN :: ::..:... . .:: : :::: .: : .:.. : : ::.. :. :.:.:::::. CCDS66 NERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQGKSQQRTFFLFDH 370 380 390 400 410 420 280 290 300 310 320 pF1KE3 LLVYCKRKHRRLKNSKASTDGHRYLFRGRINTEVMEVENVDDGT-ADFHSSGHIVVNGWK :: ::. : : : .::.. . ::. .. :: : . : : :..: CCDS66 QLVSCKKDLLR-------RDMLYY--KGRLDMDEMELVDLGDGRDKDCNLS---VKNAFK 430 440 450 460 470 330 340 350 360 370 380 pF1KE3 IHNTAKNKWFVCMAKTPEEKHEWFEAILKERER-RKGLKLGMEQDTWVMISEQGEKLYKM . . . .. .. :: :.: .:..: ::.: .. ..::: :::. .:: . CCDS66 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGME------ISENQKKLAML 480 490 500 510 520 390 400 410 420 430 440 pF1KE3 MCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHVT .... :.. CCDS66 NAQKAGHGKSKGYNRCPVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHT 530 540 550 560 570 580 >>CCDS9305.1 SPATA13 gene_id:221178|Hs108|chr13 (652 aa) initn: 570 init1: 295 opt: 651 Z-score: 632.6 bits: 128.6 E(32554): 6.5e-29 Smith-Waterman score: 719; 34.4% identity (61.1% similar) in 401 aa overlap (2-399:219-594) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSEL ::.. .. . :.. ..:. :. :. CCDS93 SEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCENKQQMRTNVIREI 190 200 210 220 230 240 40 50 60 70 80 90 pF1KE3 QKTERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVV . ::: :. :. . .... :: : : . .:.::::: ...::: . CCDS93 MDTERVYIKHLRDICEGYIR---QC--RKHTGMFTVAQLATIFGNIEDIYKFQRKFLKDL 250 260 270 280 290 300 100 110 120 130 140 150 pF1KE3 EECLHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCML :. . : .:.:.:::. .. : ::.:::.:: : : .: : : :. : : CCDS93 EKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRHFFEACRL 310 320 330 340 350 360 160 170 180 190 200 210 pF1KE3 LGGRKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNI : .. :. ..:.:.::.:.:::::: : :::: : ..:.::. . : .::: : : CCDS93 L--QQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKNVACLI 370 380 390 400 410 420 220 230 240 250 260 270 pF1KE3 NEAKRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISS-GNIQERVFFLFDN :: ::..:... . .:: : :::: .: : .:.. : : ::.. :. :.:.:::::. CCDS93 NERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQGKSQQRTFFLFDH 430 440 450 460 470 480 280 290 300 310 320 pF1KE3 LLVYCKRKHRRLKNSKASTDGHRYLFRGRINTEVMEVENVDDGT-ADFHSSGHIVVNGWK :: ::. : : : .::.. . ::. .. :: : . : : :..: CCDS93 QLVSCKKDLLR-------RDMLYY--KGRLDMDEMELVDLGDGRDKDCNLS---VKNAFK 490 500 510 520 330 340 350 360 370 380 pF1KE3 IHNTAKNKWFVCMAKTPEEKHEWFEAILKERER-RKGLKLGMEQDTWVMISEQGEKLYKM . . . .. .. :: :.: .:..: ::.: .. ..::: :::. .:: . CCDS93 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGME------ISENQKKLAML 530 540 550 560 570 580 390 400 410 420 430 440 pF1KE3 MCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHVT .... :.. CCDS93 NAQKAGHGKSKGYNRCPVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHT 590 600 610 620 630 640 >>CCDS53857.1 SPATA13 gene_id:221178|Hs108|chr13 (1277 aa) initn: 570 init1: 295 opt: 651 Z-score: 628.5 bits: 128.8 E(32554): 1.1e-28 Smith-Waterman score: 719; 34.4% identity (61.1% similar) in 401 aa overlap (2-399:844-1219) 10 20 30 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSEL ::.. .. . :.. ..:. :. :. CCDS53 SEDKEAWFPASFVRLRVNQEELSENSSSTPSEEQDEEASQSRHRHCENKQQMRTNVIREI 820 830 840 850 860 870 40 50 60 70 80 90 pF1KE3 QKTERDYVGTLEFLVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVV . ::: :. :. . .... :: : : . .:.::::: ...::: . CCDS53 MDTERVYIKHLRDICEGYIR---QC--RKHTGMFTVAQLATIFGNIEDIYKFQRKFLKDL 880 890 900 910 920 100 110 120 130 140 150 pF1KE3 EECLHPEPNAQQEVGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCML :. . : .:.:.:::. .. : ::.:::.:: : : .: : : :. : : CCDS53 EKQYNKEEPHLSEIGSCFLQNQEGFAIYSEYCNNHPGACLELANLMKQGKYRHFFEACRL 930 940 950 960 970 980 160 170 180 190 200 210 pF1KE3 LGGRKNTDVPLEGYLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNI : .. :. ..:.:.::.:.:::::: : :::: : ..:.::. . : .::: : : CCDS53 L--QQMIDIAIDGFLLTPVQKICKYPLQLAELLKYTTQEHGDYSNIKAAYEAMKNVACLI 990 1000 1010 1020 1030 1040 220 230 240 250 260 270 pF1KE3 NEAKRQMEKLEVLEEWQSHIEGWEGSNITDTCTEMLMCGVLLKISS-GNIQERVFFLFDN :: ::..:... . .:: : :::: .: : .:.. : : ::.. :. :.:.:::::. CCDS53 NERKRKLESIDKIARWQVSIVGWEGLDILDRSSELIHSGELTKITKQGKSQQRTFFLFDH 1050 1060 1070 1080 1090 1100 280 290 300 310 320 pF1KE3 LLVYCKRKHRRLKNSKASTDGHRYLFRGRINTEVMEVENVDDGT-ADFHSSGHIVVNGWK :: ::. : : : .::.. . ::. .. :: : . : : :..: CCDS53 QLVSCKKDLLR-------RDMLYY--KGRLDMDEMELVDLGDGRDKDCNLS---VKNAFK 1110 1120 1130 1140 1150 330 340 350 360 370 380 pF1KE3 IHNTAKNKWFVCMAKTPEEKHEWFEAILKERER-RKGLKLGMEQDTWVMISEQGEKLYKM . . . .. .. :: :.: .:..: ::.: .. ..::: :::. .:: . CCDS53 LVSRTTDEVYLFCAKKQEDKARWLQACADERRRVQEDKEMGME------ISENQKKLAML 1160 1170 1180 1190 1200 390 400 410 420 430 440 pF1KE3 MCRQGNLIKDRKRKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHVT .... :.. CCDS53 NAQKAGHGKSKGYNRCPVAPPHQGLHPIHQRHITMPTSVPQQQVFGLAEPKRKSSLFWHT 1210 1220 1230 1240 1250 1260 >>CCDS55430.1 ARHGEF9 gene_id:23229|Hs108|chrX (463 aa) initn: 598 init1: 312 opt: 644 Z-score: 627.9 bits: 127.3 E(32554): 1.2e-28 Smith-Waterman score: 716; 35.1% identity (62.3% similar) in 382 aa overlap (15-392:42-398) 10 20 30 40 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSELQKTERDYVGTLEF . :... ..:. :..:...::: :. :. CCDS55 WVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKD 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE3 LVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVVEECLHPEPNAQQE . ..:. :: : ..: .:..:.::::: . :.. .:. . . .: CCDS55 ICEGYLK---QC--RKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSE 80 90 100 110 120 110 120 130 140 150 160 pF1KE3 VGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCMLLGGRKNTDVPLEG .: :::. .: : ::.:::.:: : : .: : . :. : :: .. :. ..: CCDS55 IGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLL--QQMIDIAIDG 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE3 YLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNINEAKRQMEKLEVL .:.::.:.:::::: : :::: : . :::: : :: .:. : ..::: ::..:... . CCDS55 FLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKI 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE3 EEWQSHIEGWEGSNITDTCTEMLMCGVLLKISS--GNIQERVFFLFDNLLVYCKRKHRRL .::. . ::: .: : .:... : . : . : :.:::::::. .: ::. : CCDS55 AQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIR- 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE3 KNSKASTDGHRYLFRGRINTEVMEVENVDDGTAD-FHSSGHIVVNGWKIHNTAKNKWFVC : : .:::. . .:: ...:: : :. : . :..:.:: .. . CCDS55 ------RDILYY--KGRIDMDKYEVVDIEDGRDDDFNVS---MKNAFKLHNKETEEIHLF 310 320 330 340 350 350 360 370 380 390 400 pF1KE3 MAKTPEEKHEWFEAILKERER-RKGLKLGMEQDTWVMISEQGEKLYKMMCRQGNLIKDRK .:: ::: .:..:. .::. .. :.:.: :::. .. : :. CCDS55 FAKKLEEKIRWLRAFREERKMVQEDEKIGFE------ISENQKRQAAMTVRKVPKQKGVN 360 370 380 390 400 410 420 430 440 450 460 pF1KE3 RKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHVTDKHQFKPEQMLY CCDS55 SARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK 410 420 430 440 450 460 >>CCDS83477.1 ARHGEF9 gene_id:23229|Hs108|chrX (495 aa) initn: 598 init1: 312 opt: 644 Z-score: 627.5 bits: 127.3 E(32554): 1.2e-28 Smith-Waterman score: 716; 35.1% identity (62.3% similar) in 382 aa overlap (15-392:74-430) 10 20 30 40 pF1KE3 MSEDSRGDSRAESAKDLEKQLRLRVCVLSELQKTERDYVGTLEF . :... ..:. :..:...::: :. :. CCDS83 WVNQEDEVEEGPSDVQNGHLDPNSDCLCLGRPLQNRDQMRANVINEIMSTERHYIKHLKD 50 60 70 80 90 100 50 60 70 80 90 100 pF1KE3 LVSAFLHRMNQCAASKVDKNVTEETVKMLFSNIEDILAVHKEFLKVVEECLHPEPNAQQE . ..:. :: : ..: .:..:.::::: . :.. .:. . . .: CCDS83 ICEGYLK---QC--RKRRDMFSDEQLKVIFGNIEDIYRFQMGFVRDLEKQYNNDDPHLSE 110 120 130 140 150 110 120 130 140 150 160 pF1KE3 VGTCFLHFKDKFRIYDEYCSNHEKAQKLLLELNKIRTIRTFLLNCMLLGGRKNTDVPLEG .: :::. .: : ::.:::.:: : : .: : . :. : :: .. :. ..: CCDS83 IGPCFLEHQDGFWIYSEYCNNHLDACMELSKLMKDSRYQHFFEACRLL--QQMIDIAIDG 160 170 180 190 200 210 170 180 190 200 210 220 pF1KE3 YLVTPIQRICKYPLILKELLKRTPRKHSDYAAVMEALQAMKAVCSNINEAKRQMEKLEVL .:.::.:.:::::: : :::: : . :::: : :: .:. : ..::: ::..:... . CCDS83 FLLTPVQKICKYPLQLAELLKYTAQDHSDYRYVAAALAVMRNVTQQINERKRRLENIDKI 220 230 240 250 260 270 230 240 250 260 270 280 pF1KE3 EEWQSHIEGWEGSNITDTCTEMLMCGVLLKISS--GNIQERVFFLFDNLLVYCKRKHRRL .::. . ::: .: : .:... : . : . : :.:::::::. .: ::. : CCDS83 AQWQASVLDWEGEDILDRSSELIYTGEMAWIYQPYGRNQQRVFFLFDHQMVLCKKDLIR- 280 290 300 310 320 330 290 300 310 320 330 340 pF1KE3 KNSKASTDGHRYLFRGRINTEVMEVENVDDGTAD-FHSSGHIVVNGWKIHNTAKNKWFVC : : .:::. . .:: ...:: : :. : . :..:.:: .. . CCDS83 ------RDILYY--KGRIDMDKYEVVDIEDGRDDDFNVS---MKNAFKLHNKETEEIHLF 340 350 360 370 380 350 360 370 380 390 400 pF1KE3 MAKTPEEKHEWFEAILKERER-RKGLKLGMEQDTWVMISEQGEKLYKMMCRQGNLIKDRK .:: ::: .:..:. .::. .. :.:.: :::. .. : :. CCDS83 FAKKLEEKIRWLRAFREERKMVQEDEKIGFE------ISENQKRQAAMTVRKVPKQKGVN 390 400 410 420 430 410 420 430 440 450 460 pF1KE3 RKLTTFPKCFLGSEFVSWLLEIGEIHRPEEGVHLGQALLENGIIHHVTDKHQFKPEQMLY CCDS83 SARSVPPSYPPPQDPLNHGQYLVPDGIAQSQVFEFTEPKRSQSPFWQNFSRLTPFKK 440 450 460 470 480 490 1606 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:29:10 2016 done: Mon Nov 7 19:29:11 2016 Total Scan time: 3.970 Total Display time: 0.270 Function used was FASTA [36.3.4 Apr, 2011]