FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6731, 1386 aa 1>>>pF1KE6731 1386 - 1386 aa - 1386 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 14.0633+/-0.00117; mu= -16.3984+/- 0.070 mean_var=546.5238+/-112.555, 0's: 0 Z-trim(115.6): 133 B-trim: 0 in 0/54 Lambda= 0.054862 statistics sampled from 16074 (16202) to 16074 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.763), E-opt: 0.2 (0.498), width: 16 Scan time: 6.210 The best scores are: opt bits E(32554) CCDS44755.1 ROBO3 gene_id:64221|Hs108|chr11 (1386) 9556 772.3 0 CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394) 3376 283.2 3.6e-75 CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378) 3375 283.1 3.8e-75 CCDS54610.1 ROBO1 gene_id:6091|Hs108|chr3 (1551) 3222 271.0 1.8e-71 CCDS46872.2 ROBO1 gene_id:6091|Hs108|chr3 (1606) 3217 270.6 2.5e-71 CCDS54611.1 ROBO1 gene_id:6091|Hs108|chr3 (1651) 3194 268.8 8.9e-71 >>CCDS44755.1 ROBO3 gene_id:64221|Hs108|chr11 (1386 aa) initn: 9556 init1: 9556 opt: 9556 Z-score: 4106.6 bits: 772.3 E(32554): 0 Smith-Waterman score: 9556; 100.0% identity (100.0% similar) in 1386 aa overlap (1-1386:1-1386) 10 20 30 40 50 60 pF1KE6 MLRYLLKTLLQMNLFADSLAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MLRYLLKTLLQMNLFADSLAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 DAMPRIVEQPPDLLVSRGEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DAMPRIVEQPPDLLVSRGEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GALFFPRIVHGRRARPDEGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GALFFPRIVHGRRARPDEGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 EPAVLECVPPRGHPEPSVSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EPAVLECVPPRGHPEPSVSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 MAGERESAAAEVMVLERPSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MAGERESAAAEVMVLERPSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 GRYEIRSDHSLWIGHVSAEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GRYEIRSDHSLWIGHVSAEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 GESVAFQCETKGNPPPAIFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GESVAFQCETKGNPPPAIFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 YYVCQAVSVAGSILAKALLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YYVCQAVSVAGSILAKALLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 SVRWKKDGQWLQGDDLQFKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SVRWKKDGQWLQGDDLQFKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMRE 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 DWGVSPDPPTEPSSPPGAPSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 DWGVSPDPPTEPSSPPGAPSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGN 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE6 TWRTVADGVQLETHTVSGLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TWRTVADGVQLETHTVSGLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVED 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE6 PWRGQQGLAEVAVRLQEPIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGGSWTMLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PWRGQQGLAEVAVRLQEPIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGGSWTMLD 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE6 LQSPSQQSTVLRGLPPGTQIQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 LQSPSQQSTVLRGLPPGTQIQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE6 GDGNSSITVSWEPPLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GDGNSSITVSWEPPLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE6 YRTLVAAATSAGVGVPSAPVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 YRTLVAAATSAGVGVPSAPVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE6 CGALLLGLCAALYWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPMGLGPAPYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 CGALLLGLCAALYWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPMGLGPAPYS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE6 WLADSWPHPSRSPSAQEPRGSCCPSNPDPDDRYYNEAGISLYLAQTARGTAAPGEGPVYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 WLADSWPHPSRSPSAQEPRGSCCPSNPDPDDRYYNEAGISLYLAQTARGTAAPGEGPVYS 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE6 TIDPAGEELQTFHGGFPQHPSGDLGPWSQYAPPEWSQGDSGAKGGKVKLLGKPVQMPSLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TIDPAGEELQTFHGGFPQHPSGDLGPWSQYAPPEWSQGDSGAKGGKVKLLGKPVQMPSLN 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE6 WPEALPPPPPSCELSCLEGPEEELEGSSEPEEWCPPMPERSHLTEPSSSGGCLVTPSRRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 WPEALPPPPPSCELSCLEGPEEELEGSSEPEEWCPPMPERSHLTEPSSSGGCLVTPSRRE 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE6 TPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQMPRRVPLGPSSPLSVSQPMLGIREA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQMPRRVPLGPSSPLSVSQPMLGIREA 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE6 RPAGLGAGPAASPHLSPSPAPSTASSAPGRTWQGNGEMTPPLQGPRARFRKKPKALPYRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RPAGLGAGPAASPHLSPSPAPSTASSAPGRTWQGNGEMTPPLQGPRARFRKKPKALPYRR 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE6 ENSPGDLPPPPLPPPEEEASWALELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ENSPGDLPPPPLPPPEEEASWALELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDE 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE6 EAWLPYSRPSFLSRGQGTSTCSTAGSNSSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EAWLPYSRPSFLSRGQGTSTCSTAGSNSSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQK 1330 1340 1350 1360 1370 1380 pF1KE6 RREEPR :::::: CCDS44 RREEPR >>CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394 aa) initn: 3432 init1: 2134 opt: 3376 Z-score: 1463.0 bits: 283.2 E(32554): 3.6e-75 Smith-Waterman score: 3655; 44.5% identity (68.5% similar) in 1370 aa overlap (48-1364:31-1362) 20 30 40 50 60 70 pF1KE6 SLAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSR :. . .:::. :: :::::.: :..::. CCDS54 MARRHERVTRRMWTWAPGLLMMTVVFWGHQGNGQGQGSRLRQEDFPPRIVEHPSDVIVSK 10 20 30 40 50 60 80 90 100 110 120 130 pF1KE6 GEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPD :::.:: :.::::: :.:::::.: :: : ..:::.::.:::::.::: :::::::..:: CCDS54 GEPTTLNCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPD 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE6 EGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPS :: :.:::::::: :.:::::::::.:::::::.: .::::.::::.::: ::::::::. CCDS54 EGSYVCVARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPT 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 VSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLER . :.:: .:. ..: ::.:::::::.:.: :::::::.::..::.:::.: ::. :.:: CCDS54 IYWKKDKVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFER 190 200 210 220 230 240 260 270 280 290 300 310 pF1KE6 PSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVS :.:::::.::::: . : : :.:.::: : .::.:.:..:: :::.:..:..: : .. CCDS54 PTFLRRPINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTM 250 260 270 280 290 300 320 330 340 350 360 370 pF1KE6 AEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPPA . ::::: :.::: ::. :::..:.:..:::.:..:.::..: :..:.: ::::::: :: CCDS54 STDEGTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPA 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE6 IFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKA .:::::::: ::::.: ::..: :::: :.:.:: .::.:::::.:::..::::::::: CCDS54 VFWQKEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKA 370 380 390 400 410 420 440 450 460 470 480 490 pF1KE6 LLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQ ::. . : ::.::::::::::.. ... : :..::.: : . : :.: . : : . CCDS54 QLEVTDVLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPR 430 440 450 460 470 480 500 510 520 530 540 550 pF1KE6 FKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPPTEPSSPPG . .::: : :.. : : :.::: ::.::..::. : . :. :.. . . :. :: CCDS54 ATIQEQGTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTES-GATISKNYDLSDLPG 490 500 510 520 530 560 570 580 590 600 610 pF1KE6 APSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVS ::.: ::..::::.::.:.:. ...:.::::: ...:.:.:::. :. .:: CCDS54 PPSKPQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVR 540 550 560 570 580 590 620 630 640 650 660 670 pF1KE6 GLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQE ::.:::::::.:::.. :::.:::.:.:::::: :: : . :. :..: :::.. CCDS54 GLRPNTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHN 600 610 620 630 640 650 680 690 700 710 720 730 pF1KE6 PIVLGPRTLQVSWTVDGPVQLVQGFRVSWR-VAGPEG-GSWTMLDLQSPSQQSTVLRGLP :.:: : :.::.:::: :..::.:: .: ..: .. .:: :: . :...:.:: .: CCDS54 PVVLTPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLK 660 670 680 690 700 710 740 750 760 770 780 790 pF1KE6 PGTQIQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALGGDGNS-SITVSWEPP :. .:::. .: : .: : : :::::.:::.:.: :. :: ::.:::.:: CCDS54 KGVTYEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPP 720 730 740 750 760 770 800 810 820 830 840 850 pF1KE6 LPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGVG :..:::.: ::.:::::::.:::.:... . ::... :: ::. ::. :::.:::::: CCDS54 PPDHQNGIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVG 780 790 800 810 820 830 860 870 880 890 900 910 pF1KE6 VPSAPVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAALYW : : : . . .. : . ... ... :...:::.:: :.:: ..:.:. ::: CCDS54 VKSEPQPIIIGRRNEVVI-TENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYW 840 850 860 870 880 890 920 930 940 950 960 970 pF1KE6 RRKQRKELSHYTASFAYTPAVSFPHSEG-LSGASSRPPM-GLGPAPYSWLADSWPHPSR- :::.:: ::.: ::.: ...: : . .::: . . : : ::::::: : CCDS54 RRKKRKGLSNY--------AVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLP 900 910 920 930 940 950 980 990 1000 1010 1020 pF1KE6 -SPSAQEP-------RGSCCPSNPDPDDR---YYNEAGISLYLAQTARGTAAPGEGPVYS . : . : ::. : : :. . ....: . :.. . . . . CCDS54 VNNSNSGPNEIGNFGRGDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQA 960 970 980 990 1000 1010 1030 1040 1050 1060 pF1KE6 TIDPAGEELQTFHGGFPQHPSGDL-GP-WSQ------------YAPPEWSQGDSGAKGGK : : . : .:.. .. . :: : :.. :. :. ..:..:.:::: CCDS54 T--PYATT-QILHSNSIHELAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGK 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 pF1KE6 VKL---LGKPVQMPSLNWPEA-LPPPP----PSCELSCLEGPEEELEGSSEPEEWCPPMP : .:: . . .: .. ::::: :. :: . :. :.. . . ::::.: CCDS54 KKKNKNSSKPQKNNGSTWANVPLPPPPVQPLPGTELE--HYAVEQQENGYDSDSWCPPLP 1070 1080 1090 1100 1110 1120 1120 1130 1140 1150 1160 1170 pF1KE6 ERSHLTE------PSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPTDMPH ...: . .. . : : . ::. :.:::::::::::: . :: . : CCDS54 VQTYLHQGLEDELEEDDDRVPTPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQA-H 1130 1140 1150 1160 1170 1180 1180 1190 1200 1210 1220 pF1KE6 LHQMPRRVPLGPSSPL----SVSQPMLGIREARPAGLGAGPAASPHLSPSPAPSTASSAP : .. : . .. : .:: . : : .: : : . : . :.. CCDS54 LDELTRAYQFDIAKQTWHIQSNNQPPQP--PVPPLGYVSGALISD-LETDVADDDADDE- 1190 1200 1210 1220 1230 1240 1230 1240 1250 1260 1270 1280 pF1KE6 GRTWQGNGEMTPPL----QGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEEASWALE . :. :: : : . . . ... . .: . : : : ... . CCDS54 ----EEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTS--SQRPRPTSPFSTDSNTSAA 1250 1260 1270 1280 1290 1290 1300 1310 1320 1330 1340 pF1KE6 LRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCSTA : . .....:. :.: .: :::: .:::.::: : CCDS54 LSQSQRPRPTKKHKGGRMDQQPALP--HRREGMTDEEALVPYSKPSFPS----------P 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE6 GSNSSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR :..:: :..::.:: :: .. CCDS54 GGHSSSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL 1350 1360 1370 1380 1390 >>CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378 aa) initn: 3435 init1: 2137 opt: 3375 Z-score: 1462.6 bits: 283.1 E(32554): 3.8e-75 Smith-Waterman score: 3654; 44.6% identity (68.6% similar) in 1366 aa overlap (52-1364:19-1346) 30 40 50 60 70 80 pF1KE6 DISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPA ..:::. :: :::::.: :..::.:::. CCDS43 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPT 10 20 30 40 90 100 110 120 130 140 pF1KE6 TLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVY :: :.::::: :.:::::.: :: : ..:::.::.:::::.::: :::::::..:::: : CCDS43 TLNCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSY 50 60 70 80 90 100 150 160 170 180 190 200 pF1KE6 TCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWR .:::::::: :.:::::::::.:::::::.: .::::.::::.::: ::::::::.. :. CCDS43 VCVARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWK 110 120 130 140 150 160 210 220 230 240 250 260 pF1KE6 KDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFL :: .:. ..: ::.:::::::.:.: :::::::.::..::.:::.: ::. :.:::.:: CCDS43 KDKVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFL 170 180 190 200 210 220 270 280 290 300 310 320 pF1KE6 RRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDE :::.::::: . : : :.:.::: : .::.:.:..:: :::.:..:..: : .. . :: CCDS43 RRPINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDE 230 240 250 260 270 280 330 340 350 360 370 380 pF1KE6 GTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIFWQ ::: :.::: ::. :::..:.:..:::.:..:.::..: :..:.: ::::::: ::.::: CCDS43 GTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQ 290 300 310 320 330 340 390 400 410 420 430 440 pF1KE6 KEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALLEI ::::: ::::.: ::..: :::: :.:.:: .::.:::::.:::..::::::::: ::. CCDS43 KEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEV 350 360 370 380 390 400 450 460 470 480 490 500 pF1KE6 KGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFKTM . : ::.::::::::::.. ... : :..::.: : . : :.: . : : . . CCDS43 TDVLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQ 410 420 430 440 450 460 510 520 530 540 550 560 pF1KE6 ANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPPTEPSSPPGAPSQ .::: : :.. : : :.::: ::.::..::. : . :. :.. . . :. :: ::. CCDS43 EQGTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTES-GATISKNYDLSDLPGPPSK 470 480 490 500 510 520 570 580 590 600 610 620 pF1KE6 PVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVSGLQP : ::..::::.::.:.:. ...:.::::: ...:.:.:::. :. .:: ::.: CCDS43 PQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRP 530 540 550 560 570 580 630 640 650 660 670 680 pF1KE6 NTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQEPIVL ::::::.:::.. :::.:::.:.:::::: :: : . :. :..: :::..:.:: CCDS43 NTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVL 590 600 610 620 630 640 690 700 710 720 730 pF1KE6 GPRTLQVSWTVDGPVQLVQGFRVSWR-VAGPEG-GSWTMLDLQSPSQQSTVLRGLPPGTQ : :.::.:::: :..::.:: .: ..: .. .:: :: . :...:.:: .: :. CCDS43 TPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVT 650 660 670 680 690 700 740 750 760 770 780 790 pF1KE6 IQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALGGDGNS-SITVSWEPPLPSQ .:::. .: : .: : : :::::.:::.:.: :. :: ::.:::.:: :.. CCDS43 YEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDH 710 720 730 740 750 760 800 810 820 830 840 850 pF1KE6 QNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGVGVPSA :::.: ::.:::::::.:::.:... . ::... :: ::. ::. :::.::::::: : CCDS43 QNGIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSE 770 780 790 800 810 820 860 870 880 890 900 910 pF1KE6 PVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAALYWRRKQ : . . .. : . ... ... :...:::.:: :.:: ..:.:. ::::::. CCDS43 PQPIIIGRRNEVVI-TENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKK 830 840 850 860 870 880 920 930 940 950 960 970 pF1KE6 RKELSHYTASFAYTPAVSFPHSEG-LSGASSRPPM-GLGPAPYSWLADSWPHPSR--SPS :: ::.: ::.: ...: : . .::: . . : : ::::::: : . : CCDS43 RKGLSNY--------AVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNS 890 900 910 920 930 980 990 1000 1010 1020 pF1KE6 AQEP-------RGSCCPSNPDPDDR---YYNEAGISLYLAQTARGTAAPGEGPVYSTIDP . : ::. : : :. . ....: . :.. . . . .: : CCDS43 NSGPNEIGNFGRGDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQAT--P 940 950 960 970 980 990 1030 1040 1050 1060 pF1KE6 AGEELQTFHGGFPQHPSGDL-GP-WSQ------------YAPPEWSQGDSGAKGGKVKL- . : .:.. .. . :: : :.. :. :. ..:..:.:::: : CCDS43 YATT-QILHSNSIHELAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKN 1000 1010 1020 1030 1040 1050 1070 1080 1090 1100 1110 1120 pF1KE6 --LGKPVQMPSLNWPEA-LPPPP----PSCELSCLEGPEEELEGSSEPEEWCPPMPERSH .:: . . .: .. ::::: :. :: . :. :.. . . ::::.: ... CCDS43 KNSSKPQKNNGSTWANVPLPPPPVQPLPGTELE--HYAVEQQENGYDSDSWCPPLPVQTY 1060 1070 1080 1090 1100 1110 1130 1140 1150 1160 1170 pF1KE6 LTE------PSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQM : . .. . : : . ::. :.:::::::::::: . :: . :: .. CCDS43 LHQGLEDELEEDDDRVPTPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQA-HLDEL 1120 1130 1140 1150 1160 1170 1180 1190 1200 1210 1220 1230 pF1KE6 PRRVPLGPSSPL----SVSQPMLGIREARPAGLGAGPAASPHLSPSPAPSTASSAPGRTW : . .. : .:: . : : .: : : . : . :.. CCDS43 TRAYQFDIAKQTWHIQSNNQPPQP--PVPPLGYVSGALISD-LETDVADDDADDE----- 1180 1190 1200 1210 1220 1240 1250 1260 1270 1280 pF1KE6 QGNGEMTPPL----QGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEEASWALELRAA . :. :: : : . . . ... . .: . : : : ... . : . CCDS43 EEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTS--SQRPRPTSPFSTDSNTSAALSQS 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 1330 1340 pF1KE6 GSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCSTAGSNS .....:. :.: .: :::: .:::.::: : :..: CCDS43 QRPRPTKKHKGGRMDQQPALP--HRREGMTDEEALVPYSKPSFPS----------PGGHS 1290 1300 1310 1320 1330 1350 1360 1370 1380 pF1KE6 SRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR : :..::.:: :: .. CCDS43 SSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL 1340 1350 1360 1370 >>CCDS54610.1 ROBO1 gene_id:6091|Hs108|chr3 (1551 aa) initn: 3329 init1: 1413 opt: 3222 Z-score: 1396.5 bits: 271.0 E(32554): 1.8e-71 Smith-Waterman score: 3390; 44.8% identity (71.5% similar) in 1231 aa overlap (53-1219:18-1227) 30 40 50 60 70 80 pF1KE6 ISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPAT .:::. :: :::::.: ::.::.::::: CCDS54 MIAEPAHFYLFGLICLCSGSRLRQEDFPPRIVEHPSDLIVSKGEPAT 10 20 30 40 90 100 110 120 130 140 pF1KE6 LPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVYT : :.::::: :.:::::.: :: : ..:::.::.:::::.::: ::::::..:::::::. CCDS54 LNCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYV 50 60 70 80 90 100 150 160 170 180 190 200 pF1KE6 CVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWRK :::::::: :.:.:::::::.:::::::.:..:.::::::::.:: ::::::::..::.: CCDS54 CVARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKK 110 120 130 140 150 160 210 220 230 240 250 260 pF1KE6 DGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFLR ::. : ... ::::::::::...: ::::: ::::..::.::::: .::. :::::::.. CCDS54 DGSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVK 170 180 190 200 210 220 270 280 290 300 310 320 pF1KE6 RPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDEG :: : .: .: . : ::..::: : .::::.::::: .:::::.::.: : .:.: : : CCDS54 RPSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMG 230 240 250 260 270 280 330 340 350 360 370 pF1KE6 TYTCVAENSVGRAEASGSLSVHV---PPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIF .::::::: ::.::::..:.:.: ::..:..:.::..: :..:.::::. ::: :::: CCDS54 SYTCVAENMVGKAEASATLTVQVGSEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIF 290 300 310 320 330 340 380 390 400 410 420 430 pF1KE6 WQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALL :..:::: ::: : : ..::::: :.:.:: :::.:.:::.::...:::::..:: : CCDS54 WRREGSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYL 350 360 370 380 390 400 440 450 460 470 480 490 pF1KE6 EIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFK :. . : :::: :::.:::... .. : : .::.: :.. :.::: .. .: ..: CCDS54 EVTDVIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIK 410 420 430 440 450 460 500 510 520 530 540 550 pF1KE6 TMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPP--TEPSSPPG . ::.: : .. : : :.:.:.. .::::::......: .:: .:: :.:. :. CCDS54 QLENGVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQE-FGVPVQPPRPTDPNLIPS 470 480 490 500 510 520 560 570 580 590 600 610 pF1KE6 APSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVS :::.: ::....:..::.:.:: ..::. :::.::::: :.:..:.:::..:. :: ... CCDS54 APSKPEVTDVSRNTVTLSWQPNLNSGATPTSYIIEAFSHASGSSWQTVAENVKTETSAIK 530 540 550 560 570 580 620 630 640 650 660 670 pF1KE6 GLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQE ::.::.::::::::..:.:.:.:: .:.::.::: :. : . :. :......:.. CCDS54 GLKPNAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHN 590 600 610 620 630 640 680 690 700 710 720 730 pF1KE6 PIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGG--SWTMLDLQSPSQQSTVLRGLP : ::. ...: :::: : .::... .: .: . : .: ......:...:.:. : CCDS54 PTVLSSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLR 650 660 670 680 690 700 740 750 760 770 780 790 pF1KE6 PGTQIQIKVQAQGQEGLGAES-LSVTRSIPEEAPSGPPQGVAVALGGDGN-SSITVSWEP :.. .::.. .: ::.: .. .... :::::.:::::.:. .::: ..: :::.: CCDS54 KGVNYEIKARPFFNEFQGADSEIKFAKTL-EEAPSAPPQGVTVS-KNDGNGTAILVSWQP 710 720 730 740 750 760 800 810 820 830 840 850 pF1KE6 PLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGV : . :::.. ::..::::::.:.:.:... : . :... ::::. : . :::.:.:: CCDS54 PPEDTQNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGS 770 780 790 800 810 820 860 870 880 890 900 910 pF1KE6 GVPSAPVLVQLPSPPD-LEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAAL :: : : ..:: . . . : .: .:: ... :...:::.:: :::: .:. . : CCDS54 GVKSEPQFIQLDAHGNPVSPEDQV--SLAQQISDVVKQPAFIAGIGAACWIILMVFSIWL 830 840 850 860 870 880 920 930 940 950 960 970 pF1KE6 YWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPM-GLG-PAPYSWLADSWPHPS : .::.:. : :...: :.. .. ....:: . ... :: ::::.::. . CCDS54 YRHRKKRNGL---TSTYAGIRKVTYQRGGEAVSSGGRPGLLNISEPAAQPWLADTWPNTG 890 900 910 920 930 980 990 1000 1010 pF1KE6 RSPSAQEPRGSCCPS---NPDPDDRYYNEAG-----ISLYLAQTA------RGTAAPGE- . . . ::: . : : . :.. : . : :. :.. :: CCDS54 NNHN--DCSISCCTAGNGNSDSNLTTYSRPGQPTPYATTQLIQSNLSNNMNNGSGDSGEK 940 950 960 970 980 990 1020 1030 1040 1050 pF1KE6 ------------GPVYSTIDPAGEELQTFHGG------FPQHPSGDLGPWSQYAPPEWSQ .:: .: .. . .... .: . : : . ..: . .. CCDS54 HWKPLGQQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYNQSYDQNTGGSYNSSDRGS 1000 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 pF1KE6 GDSGAKGGKVKLLGKPVQMPS---LNWPEALPPPP--PSCELSCLEGPEEELEGSSEPEE . ::..: : : : ..:. .:: . ::::: : . : : . .. : . : CCDS54 STSGSQGHK-KGARTP-KVPKQGGMNWADLLPPPPAHPPPH-SNSEEYNISVDESYDQEM 1060 1070 1080 1090 1100 1110 1120 1130 1140 1150 1160 pF1KE6 WCPPMPERSHLT------EPSSSGGCLVTPSRRETPSPTP-SYGQQSTATLTPSPPDPPQ :: : : .: : . : . : : . ::. ::..:::::::::: . : CCDS54 PCPVPPARMYLQQDELEEEEDERGP--TPPVRGAASSPAAVSYSHQSTATLTPSPQEELQ 1120 1130 1140 1150 1160 1170 1170 1180 1190 1200 1210 pF1KE6 P-----PTDMPHLHQMP--RRVPLGPSSPLSVSQPMLGIREARPAGLGAGPAASPHLSPS : : . :....: :: :..: : .: : . : .:: .: . . CCDS54 PMLQDCPEETGHMQHQPDRRRQPVSPPPP---PRP---ISPPHTYGYISGPLVSDMDTDA 1180 1190 1200 1210 1220 1220 1230 1240 1250 1260 1270 pF1KE6 PAPSTASSAPGRTWQGNGEMTPPLQGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEE : CCDS54 PEEEEDEADMEVAKMQTRRLLLRGLEQTPASSVGDLESSVTGSMINGWGSASEEDNISSG 1230 1240 1250 1260 1270 1280 >>CCDS46872.2 ROBO1 gene_id:6091|Hs108|chr3 (1606 aa) initn: 3329 init1: 1413 opt: 3217 Z-score: 1394.1 bits: 270.6 E(32554): 2.5e-71 Smith-Waterman score: 3339; 42.2% identity (69.1% similar) in 1380 aa overlap (53-1372:18-1351) 30 40 50 60 70 80 pF1KE6 ISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPAT .:::. :: :::::.: ::.::.::::: CCDS46 MIAEPAHFYLFGLICLCSGSRLRQEDFPPRIVEHPSDLIVSKGEPAT 10 20 30 40 90 100 110 120 130 140 pF1KE6 LPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVYT : :.::::: :.:::::.: :: : ..:::.::.:::::.::: ::::::..:::::::. CCDS46 LNCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYV 50 60 70 80 90 100 150 160 170 180 190 200 pF1KE6 CVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWRK :::::::: :.:.:::::::.:::::::.:..:.::::::::.:: ::::::::..::.: CCDS46 CVARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKK 110 120 130 140 150 160 210 220 230 240 250 260 pF1KE6 DGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFLR ::. : ... ::::::::::...: ::::: ::::..::.::::: .::. :::::::.. CCDS46 DGSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVK 170 180 190 200 210 220 270 280 290 300 310 320 pF1KE6 RPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDEG :: : .: .: . : ::..::: : .::::.::::: .:::::.::.: : .:.: : : CCDS46 RPSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMG 230 240 250 260 270 280 330 340 350 360 370 pF1KE6 TYTCVAENSVGRAEASGSLSVHV---PPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIF .::::::: ::.::::..:.:.: ::..:..:.::..: :..:.::::. ::: :::: CCDS46 SYTCVAENMVGKAEASATLTVQVGSEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIF 290 300 310 320 330 340 380 390 400 410 420 430 pF1KE6 WQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALL :..:::: ::: : : ..::::: :.:.:: :::.:.:::.::...:::::..:: : CCDS46 WRREGSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYL 350 360 370 380 390 400 440 450 460 470 480 490 pF1KE6 EIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFK :. . : :::: :::.:::... .. : : .::.: :.. :.::: .. .: ..: CCDS46 EVTDVIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIK 410 420 430 440 450 460 500 510 520 530 540 550 pF1KE6 TMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPP--TEPSSPPG . ::.: : .. : : :.:.:.. .::::::......: .:: .:: :.:. :. CCDS46 QLENGVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQE-FGVPVQPPRPTDPNLIPS 470 480 490 500 510 520 560 570 580 590 600 610 pF1KE6 APSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVS :::.: ::....:..::.:.:: ..::. :::.::::: :.:..:.:::..:. :: ... CCDS46 APSKPEVTDVSRNTVTLSWQPNLNSGATPTSYIIEAFSHASGSSWQTVAENVKTETSAIK 530 540 550 560 570 580 620 630 640 650 660 670 pF1KE6 GLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQE ::.::.::::::::..:.:.:.:: .:.::.::: :. : . :. :......:.. CCDS46 GLKPNAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHN 590 600 610 620 630 640 680 690 700 710 720 730 pF1KE6 PIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGG--SWTMLDLQSPSQQSTVLRGLP : ::. ...: :::: : .::... .: .: . : .: ......:...:.:. : CCDS46 PTVLSSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLR 650 660 670 680 690 700 740 750 760 770 780 790 pF1KE6 PGTQIQIKVQAQGQEGLGAES-LSVTRSIPEEAPSGPPQGVAVALGGDGN-SSITVSWEP :.. .::.. .: ::.: .. .... :::::.:::::.:. .::: ..: :::.: CCDS46 KGVNYEIKARPFFNEFQGADSEIKFAKTL-EEAPSAPPQGVTVS-KNDGNGTAILVSWQP 710 720 730 740 750 760 800 810 820 830 840 850 pF1KE6 PLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGV : . :::.. ::..::::::.:.:.:... : . :... ::::. : . :::.:.:: CCDS46 PPEDTQNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGS 770 780 790 800 810 820 860 870 880 890 900 910 pF1KE6 GVPSAPVLVQLPSPPD-LEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAAL :: : : ..:: . . . : .:. :: ... :...:::.:: :::: .:. . : CCDS46 GVKSEPQFIQLDAHGNPVSPEDQVS--LAQQISDVVKQPAFIAGIGAACWIILMVFSIWL 830 840 850 860 870 880 920 930 940 950 960 970 pF1KE6 YWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPM-GLG-PAPYSWLADSWPHPS : .::.:. : :...: :.. .. ....:: . ... :: ::::.::. . CCDS46 YRHRKKRNGL---TSTYAGIRKVTYQRGGEAVSSGGRPGLLNISEPAAQPWLADTWPNTG 890 900 910 920 930 980 990 1000 1010 1020 pF1KE6 RSPSAQEPRGSCCPS---NPDPDDRYYNE-----AGISLYLAQTARGTAAPGEGPVYSTI . . . ::: . : : . :.. :. . : . . : :. ::. . CCDS46 NNHN--DCSISCCTAGNGNSDSNLTTYSRPADCIANYNNQLDNKQTNLMLP-ESTVYGDV 940 950 960 970 980 990 1030 1040 1050 1060 pF1KE6 DPAGE--ELQTFHG-----GFPQHPSGDLGPW--SQYAPPEWSQ------GDSGAKG--- : ... :..::.. : .:::. :. .: . :. :::: : CCDS46 DLSNKINEMKTFNSPNLKDGRFVNPSGQPTPYATTQLIQSNLSNNMNNGSGDSGEKHWKP 1000 1010 1020 1030 1040 1050 1070 1080 1090 1100 1110 pF1KE6 -GKVKLLGKPVQMP-----SLNWP-EALPPPPPSCELSCLEGPEEELEGSSEPEEWCPPM :. : :::. .:: .: ::. . .. ... :: . . CCDS46 LGQQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYN--QSYDQNTGGSYNSSD----- 1060 1070 1080 1090 1100 1120 1130 1140 1150 1160 pF1KE6 PERSHLTEPSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPT--------- . ::..: . .::. .:. : .. : : : :: : : . CCDS46 -------RGSSTSGSQGHKKGARTPK-VPKQGGMNWADLLPPPPAHPPPHSNSEEYNISV 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 1210 1220 pF1KE6 DMPHLHQMPRRVPLGPSSPLSVSQPMLGIREAR--PAGLGAGPAASPHLSPSPAPSTASS : . ..:: :. :. . ..: : .: . :. : :.:: :::. CCDS46 DESYDQEMP--CPVPPAR-MYLQQDELEEEEDERGPTPPVRGAASSPAAVSYSHQSTATL 1170 1180 1190 1200 1210 1230 1240 1250 1260 1270 1280 pF1KE6 APGRTWQGNGEMTPPLQG-PRARFRKKPKALPYRRENSPGDLPPPPLP--PPEEEASWAL .: . . :. : :: :. . . . : ::.. : . :::: : ::. . . CCDS46 TP----SPQEELQPMLQDCPEETGHMQHQ--PDRRRQ-PVSPPPPPRPISPPHTYGYISG 1220 1230 1240 1250 1260 1270 1290 1300 1310 1320 1330 1340 pF1KE6 ELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCST : ...:.. :. .. .... . ..:.: : : : : :. : :. CCDS46 PL--VSDMDTDAPEEEEDEADMEVAKMQTRRLLLRGLEQ-TPAS-----SVGDLES--SV 1280 1290 1300 1310 1320 1350 1360 1370 1380 pF1KE6 AGSN-SSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR .:: .. ::.: . . . ::: :.. : CCDS46 TGSMINGWGSASEEDNISSGRSSVSSSDGSFFTDADFAQAVAAAAEYAGLKVARRQMQDA 1330 1340 1350 1360 1370 1380 >>CCDS54611.1 ROBO1 gene_id:6091|Hs108|chr3 (1651 aa) initn: 3382 init1: 2089 opt: 3194 Z-score: 1384.1 bits: 268.8 E(32554): 8.9e-71 Smith-Waterman score: 3367; 42.3% identity (69.1% similar) in 1389 aa overlap (49-1372:51-1396) 20 30 40 50 60 70 pF1KE6 LAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLN--GSRVGPEDAMPRIVEQPPDLLVS : ::. :::. :: :::::.: ::.:: CCDS54 HLFLAQLIPDPEDVERGNDHGTPIPTSDNDDNSLGYTGSRLRQEDFPPRIVEHPSDLIVS 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE6 RGEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARP .:::::: :.::::: :.:::::.: :: : ..:::.::.:::::.::: ::::::..:: CCDS54 KGEPATLNCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRP 90 100 110 120 130 140 140 150 160 170 180 190 pF1KE6 DEGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEP :::::.:::::::: :.:.:::::::.:::::::.:..:.::::::::.:: :::::::: CCDS54 DEGVYVCVARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEP 150 160 170 180 190 200 200 210 220 230 240 250 pF1KE6 SVSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLE ..::.:::. : ... ::::::::::...: ::::: ::::..::.::::: .::. ::: CCDS54 TISWKKDGSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLE 210 220 230 240 250 260 260 270 280 290 300 310 pF1KE6 RPSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHV ::::..:: : .: .: . : ::..::: : .::::.::::: .:::::.::.: : .: CCDS54 RPSFVKRPSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKV 270 280 290 300 310 320 320 330 340 350 360 370 pF1KE6 SAEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPP .: : :.::::::: ::.::::..:.:. ::..:..:.::..: :..:.::::. ::: : CCDS54 TAGDMGSYTCVAENMVGKAEASATLTVQEPPHFVVKPRDQVVALGRTVTFQCEATGNPQP 330 340 350 360 370 380 380 390 400 410 420 430 pF1KE6 AIFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAK ::::..:::: ::: : : ..::::: :.:.:: :::.:.:::.::...:::::..: CCDS54 AIFWRREGSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITK 390 400 410 420 430 440 440 450 460 470 480 490 pF1KE6 ALLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDL : ::. . : :::: :::.:::... .. : : .::.: :.. :.::: .. .: CCDS54 AYLEVTDVIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDS 450 460 470 480 490 500 500 510 520 530 540 550 pF1KE6 QFKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPP--TEPSS ..: . ::.: : .. : : :.:.:.. .::::::......: .:: .:: :.:. CCDS54 RIKQLENGVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQE-FGVPVQPPRPTDPNL 510 520 530 540 550 560 570 580 590 600 610 pF1KE6 PPGAPSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETH :.:::.: ::....:..::.:.:: ..::. :::.::::: :.:..:.:::..:. :: CCDS54 IPSAPSKPEVTDVSRNTVTLSWQPNLNSGATPTSYIIEAFSHASGSSWQTVAENVKTETS 560 570 580 590 600 610 620 630 640 650 660 670 pF1KE6 TVSGLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVR ...::.::.::::::::..:.:.:.:: .:.::.::: :. : . :. :...... CCDS54 AIKGLKPNAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLH 620 630 640 650 660 670 680 690 700 710 720 730 pF1KE6 LQEPIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGG--SWTMLDLQSPSQQSTVLR :..: ::. ...: :::: : .::... .: .: . : .: ......:...:.:. CCDS54 LHNPTVLSSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIP 680 690 700 710 720 730 740 750 760 770 780 790 pF1KE6 GLPPGTQIQIKVQAQGQEGLGAES-LSVTRSIPEEAPSGPPQGVAVALGGDGN-SSITVS : :.. .::.. .: ::.: .. .... :::::.:::::.:. .::: ..: :: CCDS54 DLRKGVNYEIKARPFFNEFQGADSEIKFAKTL-EEAPSAPPQGVTVS-KNDGNGTAILVS 740 750 760 770 780 790 800 810 820 830 840 850 pF1KE6 WEPPLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATS :.:: . :::.. ::..::::::.:.:.:... : . :... ::::. : . :::.:. CCDS54 WQPPPEDTQNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTG 800 810 820 830 840 850 860 870 880 890 900 pF1KE6 AGVGVPSAPVLVQLPSPPD-LEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLC :: :: : : ..:: . . . : : ..:: ... :...:::.:: :::: .:. . CCDS54 AGSGVKSEPQFIQLDAHGNPVSP--EDQVSLAQQISDVVKQPAFIAGIGAACWIILMVFS 860 870 880 890 900 910 910 920 930 940 950 960 pF1KE6 AALYWRRKQRKELSHYTA------SFAYTPAVSFPHSEGLSGASSRPPM-GLG-PAPYSW :: .::.:. :. : ::..::.:.. .. ....:: . ... :: : CCDS54 IWLYRHRKKRNGLTSTYAGIRKVPSFTFTPTVTYQRGGEAVSSGGRPGLLNISEPAAQPW 920 930 940 950 960 970 970 980 990 1000 1010 pF1KE6 LADSWPHPSRSPSAQEPRGSCCPS---NPDPDDRYYNE-----AGISLYLAQTARGTAAP :::.::. . . . . ::: . : : . :.. :. . : . . : CCDS54 LADTWPNTGNNHN--DCSISCCTAGNGNSDSNLTTYSRPADCIANYNNQLDNKQTNLMLP 980 990 1000 1010 1020 1030 1020 1030 1040 1050 pF1KE6 GEGPVYSTIDPAGE--ELQTFHG-----GFPQHPSGDLGPW--SQYAPPEWSQ------G :. ::. .: ... :..::.. : .:::. :. .: . :. : CCDS54 -ESTVYGDVDLSNKINEMKTFNSPNLKDGRFVNPSGQPTPYATTQLIQSNLSNNMNNGSG 1040 1050 1060 1070 1080 1090 1060 1070 1080 1090 1100 pF1KE6 DSGAKG----GKVKLLGKPVQMP-----SLNWP-EALPPPPPSCELSCLEGPEEELEGSS ::: : :. : :::. .:: .: ::. . .. ... :: CCDS54 DSGEKHWKPLGQQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYN--QSYDQNTGGSY 1100 1110 1120 1130 1140 1150 1110 1120 1130 1140 1150 1160 pF1KE6 EPEEWCPPMPERSHLTEPSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPT . . . ::..: . .::. .:. : .. : : : :: : : . CCDS54 NSSD------------RGSSTSGSQGHKKGARTPK-VPKQGGMNWADLLPPPPAHPPPHS 1160 1170 1180 1190 1170 1180 1190 1200 1210 pF1KE6 ---------DMPHLHQMPRRVPLGPSSPLSVSQPMLGIREAR--PAGLGAGPAASPHLSP : . ..:: :. :. . ..: : .: . :. : :.:: CCDS54 NSEEYNISVDESYDQEMP--CPVPPAR-MYLQQDELEEEEDERGPTPPVRGAASSPAAVS 1200 1210 1220 1230 1240 1250 1220 1230 1240 1250 1260 1270 pF1KE6 SPAPSTASSAPGRTWQGNGEMTPPLQG-PRARFRKKPKALPYRRENSPGDLPPPPLP--P :::. .:. . :. : :: :. . . . : ::.. : . :::: : : CCDS54 YSHQSTATLTPS----PQEELQPMLQDCPEETGHMQHQ--PDRRRQ-PVSPPPPPRPISP 1260 1270 1280 1290 1300 1280 1290 1300 1310 1320 1330 pF1KE6 PEEEASWALELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSR :. . . : ...:.. :. .. .... . ..:.: : : : : CCDS54 PHTYGYISGPL--VSDMDTDAPEEEEDEADMEVAKMQTRRLLLRGLEQ-TPAS-----SV 1310 1320 1330 1340 1350 1340 1350 1360 1370 1380 pF1KE6 GQGTSTCSTAGSN-SSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR :. : :..:: .. ::.: . . . ::: :.. : CCDS54 GDLES--SVTGSMINGWGSASEEDNISSGRSSVSSSDGSFFTDADFAQAVAAAAEYAGLK 1360 1370 1380 1390 1400 1410 CCDS54 VARRQMQDAAGRRHFHASQCPRPTSPVSTDSNMSAAVMQKTRPAKKLKHQPGHLRRETYT 1420 1430 1440 1450 1460 1470 1386 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 15:48:45 2016 done: Tue Nov 8 15:48:46 2016 Total Scan time: 6.210 Total Display time: 0.550 Function used was FASTA [36.3.4 Apr, 2011]