FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6731, 1386 aa
1>>>pF1KE6731 1386 - 1386 aa - 1386 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 14.0633+/-0.00117; mu= -16.3984+/- 0.070
mean_var=546.5238+/-112.555, 0's: 0 Z-trim(115.6): 133 B-trim: 0 in 0/54
Lambda= 0.054862
statistics sampled from 16074 (16202) to 16074 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.763), E-opt: 0.2 (0.498), width: 16
Scan time: 6.210
The best scores are: opt bits E(32554)
CCDS44755.1 ROBO3 gene_id:64221|Hs108|chr11 (1386) 9556 772.3 0
CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394) 3376 283.2 3.6e-75
CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378) 3375 283.1 3.8e-75
CCDS54610.1 ROBO1 gene_id:6091|Hs108|chr3 (1551) 3222 271.0 1.8e-71
CCDS46872.2 ROBO1 gene_id:6091|Hs108|chr3 (1606) 3217 270.6 2.5e-71
CCDS54611.1 ROBO1 gene_id:6091|Hs108|chr3 (1651) 3194 268.8 8.9e-71
>>CCDS44755.1 ROBO3 gene_id:64221|Hs108|chr11 (1386 aa)
initn: 9556 init1: 9556 opt: 9556 Z-score: 4106.6 bits: 772.3 E(32554): 0
Smith-Waterman score: 9556; 100.0% identity (100.0% similar) in 1386 aa overlap (1-1386:1-1386)
10 20 30 40 50 60
pF1KE6 MLRYLLKTLLQMNLFADSLAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MLRYLLKTLLQMNLFADSLAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 DAMPRIVEQPPDLLVSRGEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DAMPRIVEQPPDLLVSRGEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 GALFFPRIVHGRRARPDEGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GALFFPRIVHGRRARPDEGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 EPAVLECVPPRGHPEPSVSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EPAVLECVPPRGHPEPSVSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 MAGERESAAAEVMVLERPSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MAGERESAAAEVMVLERPSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 GRYEIRSDHSLWIGHVSAEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GRYEIRSDHSLWIGHVSAEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 GESVAFQCETKGNPPPAIFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GESVAFQCETKGNPPPAIFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 YYVCQAVSVAGSILAKALLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YYVCQAVSVAGSILAKALLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE6 SVRWKKDGQWLQGDDLQFKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SVRWKKDGQWLQGDDLQFKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMRE
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE6 DWGVSPDPPTEPSSPPGAPSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 DWGVSPDPPTEPSSPPGAPSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGN
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE6 TWRTVADGVQLETHTVSGLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TWRTVADGVQLETHTVSGLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVED
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE6 PWRGQQGLAEVAVRLQEPIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGGSWTMLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PWRGQQGLAEVAVRLQEPIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGGSWTMLD
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE6 LQSPSQQSTVLRGLPPGTQIQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LQSPSQQSTVLRGLPPGTQIQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE6 GDGNSSITVSWEPPLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GDGNSSITVSWEPPLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE6 YRTLVAAATSAGVGVPSAPVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 YRTLVAAATSAGVGVPSAPVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE6 CGALLLGLCAALYWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPMGLGPAPYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 CGALLLGLCAALYWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPMGLGPAPYS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE6 WLADSWPHPSRSPSAQEPRGSCCPSNPDPDDRYYNEAGISLYLAQTARGTAAPGEGPVYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 WLADSWPHPSRSPSAQEPRGSCCPSNPDPDDRYYNEAGISLYLAQTARGTAAPGEGPVYS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE6 TIDPAGEELQTFHGGFPQHPSGDLGPWSQYAPPEWSQGDSGAKGGKVKLLGKPVQMPSLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TIDPAGEELQTFHGGFPQHPSGDLGPWSQYAPPEWSQGDSGAKGGKVKLLGKPVQMPSLN
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE6 WPEALPPPPPSCELSCLEGPEEELEGSSEPEEWCPPMPERSHLTEPSSSGGCLVTPSRRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 WPEALPPPPPSCELSCLEGPEEELEGSSEPEEWCPPMPERSHLTEPSSSGGCLVTPSRRE
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE6 TPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQMPRRVPLGPSSPLSVSQPMLGIREA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQMPRRVPLGPSSPLSVSQPMLGIREA
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE6 RPAGLGAGPAASPHLSPSPAPSTASSAPGRTWQGNGEMTPPLQGPRARFRKKPKALPYRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RPAGLGAGPAASPHLSPSPAPSTASSAPGRTWQGNGEMTPPLQGPRARFRKKPKALPYRR
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE6 ENSPGDLPPPPLPPPEEEASWALELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ENSPGDLPPPPLPPPEEEASWALELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDE
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE6 EAWLPYSRPSFLSRGQGTSTCSTAGSNSSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EAWLPYSRPSFLSRGQGTSTCSTAGSNSSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQK
1330 1340 1350 1360 1370 1380
pF1KE6 RREEPR
::::::
CCDS44 RREEPR
>>CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394 aa)
initn: 3432 init1: 2134 opt: 3376 Z-score: 1463.0 bits: 283.2 E(32554): 3.6e-75
Smith-Waterman score: 3655; 44.5% identity (68.5% similar) in 1370 aa overlap (48-1364:31-1362)
20 30 40 50 60 70
pF1KE6 SLAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSR
:. . .:::. :: :::::.: :..::.
CCDS54 MARRHERVTRRMWTWAPGLLMMTVVFWGHQGNGQGQGSRLRQEDFPPRIVEHPSDVIVSK
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE6 GEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPD
:::.:: :.::::: :.:::::.: :: : ..:::.::.:::::.::: :::::::..::
CCDS54 GEPTTLNCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPD
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE6 EGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPS
:: :.:::::::: :.:::::::::.:::::::.: .::::.::::.::: ::::::::.
CCDS54 EGSYVCVARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPT
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE6 VSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLER
. :.:: .:. ..: ::.:::::::.:.: :::::::.::..::.:::.: ::. :.::
CCDS54 IYWKKDKVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFER
190 200 210 220 230 240
260 270 280 290 300 310
pF1KE6 PSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVS
:.:::::.::::: . : : :.:.::: : .::.:.:..:: :::.:..:..: : ..
CCDS54 PTFLRRPINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTM
250 260 270 280 290 300
320 330 340 350 360 370
pF1KE6 AEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPPA
. ::::: :.::: ::. :::..:.:..:::.:..:.::..: :..:.: ::::::: ::
CCDS54 STDEGTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPA
310 320 330 340 350 360
380 390 400 410 420 430
pF1KE6 IFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKA
.:::::::: ::::.: ::..: :::: :.:.:: .::.:::::.:::..:::::::::
CCDS54 VFWQKEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKA
370 380 390 400 410 420
440 450 460 470 480 490
pF1KE6 LLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQ
::. . : ::.::::::::::.. ... : :..::.: : . : :.: . : : .
CCDS54 QLEVTDVLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPR
430 440 450 460 470 480
500 510 520 530 540 550
pF1KE6 FKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPPTEPSSPPG
. .::: : :.. : : :.::: ::.::..::. : . :. :.. . . :. ::
CCDS54 ATIQEQGTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTES-GATISKNYDLSDLPG
490 500 510 520 530
560 570 580 590 600 610
pF1KE6 APSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVS
::.: ::..::::.::.:.:. ...:.::::: ...:.:.:::. :. .::
CCDS54 PPSKPQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVR
540 550 560 570 580 590
620 630 640 650 660 670
pF1KE6 GLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQE
::.:::::::.:::.. :::.:::.:.:::::: :: : . :. :..: :::..
CCDS54 GLRPNTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHN
600 610 620 630 640 650
680 690 700 710 720 730
pF1KE6 PIVLGPRTLQVSWTVDGPVQLVQGFRVSWR-VAGPEG-GSWTMLDLQSPSQQSTVLRGLP
:.:: : :.::.:::: :..::.:: .: ..: .. .:: :: . :...:.:: .:
CCDS54 PVVLTPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLK
660 670 680 690 700 710
740 750 760 770 780 790
pF1KE6 PGTQIQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALGGDGNS-SITVSWEPP
:. .:::. .: : .: : : :::::.:::.:.: :. :: ::.:::.::
CCDS54 KGVTYEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPP
720 730 740 750 760 770
800 810 820 830 840 850
pF1KE6 LPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGVG
:..:::.: ::.:::::::.:::.:... . ::... :: ::. ::. :::.::::::
CCDS54 PPDHQNGIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVG
780 790 800 810 820 830
860 870 880 890 900 910
pF1KE6 VPSAPVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAALYW
: : : . . .. : . ... ... :...:::.:: :.:: ..:.:. :::
CCDS54 VKSEPQPIIIGRRNEVVI-TENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYW
840 850 860 870 880 890
920 930 940 950 960 970
pF1KE6 RRKQRKELSHYTASFAYTPAVSFPHSEG-LSGASSRPPM-GLGPAPYSWLADSWPHPSR-
:::.:: ::.: ::.: ...: : . .::: . . : : ::::::: :
CCDS54 RRKKRKGLSNY--------AVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLP
900 910 920 930 940 950
980 990 1000 1010 1020
pF1KE6 -SPSAQEP-------RGSCCPSNPDPDDR---YYNEAGISLYLAQTARGTAAPGEGPVYS
. : . : ::. : : :. . ....: . :.. . . . .
CCDS54 VNNSNSGPNEIGNFGRGDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQA
960 970 980 990 1000 1010
1030 1040 1050 1060
pF1KE6 TIDPAGEELQTFHGGFPQHPSGDL-GP-WSQ------------YAPPEWSQGDSGAKGGK
: : . : .:.. .. . :: : :.. :. :. ..:..:.::::
CCDS54 T--PYATT-QILHSNSIHELAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGK
1020 1030 1040 1050 1060
1070 1080 1090 1100 1110
pF1KE6 VKL---LGKPVQMPSLNWPEA-LPPPP----PSCELSCLEGPEEELEGSSEPEEWCPPMP
: .:: . . .: .. ::::: :. :: . :. :.. . . ::::.:
CCDS54 KKKNKNSSKPQKNNGSTWANVPLPPPPVQPLPGTELE--HYAVEQQENGYDSDSWCPPLP
1070 1080 1090 1100 1110 1120
1120 1130 1140 1150 1160 1170
pF1KE6 ERSHLTE------PSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPTDMPH
...: . .. . : : . ::. :.:::::::::::: . :: . :
CCDS54 VQTYLHQGLEDELEEDDDRVPTPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQA-H
1130 1140 1150 1160 1170 1180
1180 1190 1200 1210 1220
pF1KE6 LHQMPRRVPLGPSSPL----SVSQPMLGIREARPAGLGAGPAASPHLSPSPAPSTASSAP
: .. : . .. : .:: . : : .: : : . : . :..
CCDS54 LDELTRAYQFDIAKQTWHIQSNNQPPQP--PVPPLGYVSGALISD-LETDVADDDADDE-
1190 1200 1210 1220 1230 1240
1230 1240 1250 1260 1270 1280
pF1KE6 GRTWQGNGEMTPPL----QGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEEASWALE
. :. :: : : . . . ... . .: . : : : ... .
CCDS54 ----EEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTS--SQRPRPTSPFSTDSNTSAA
1250 1260 1270 1280 1290
1290 1300 1310 1320 1330 1340
pF1KE6 LRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCSTA
: . .....:. :.: .: :::: .:::.::: :
CCDS54 LSQSQRPRPTKKHKGGRMDQQPALP--HRREGMTDEEALVPYSKPSFPS----------P
1300 1310 1320 1330 1340
1350 1360 1370 1380
pF1KE6 GSNSSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR
:..:: :..::.:: :: ..
CCDS54 GGHSSSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL
1350 1360 1370 1380 1390
>>CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378 aa)
initn: 3435 init1: 2137 opt: 3375 Z-score: 1462.6 bits: 283.1 E(32554): 3.8e-75
Smith-Waterman score: 3654; 44.6% identity (68.6% similar) in 1366 aa overlap (52-1364:19-1346)
30 40 50 60 70 80
pF1KE6 DISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPA
..:::. :: :::::.: :..::.:::.
CCDS43 MSLLMFTQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPT
10 20 30 40
90 100 110 120 130 140
pF1KE6 TLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVY
:: :.::::: :.:::::.: :: : ..:::.::.:::::.::: :::::::..:::: :
CCDS43 TLNCKAEGRPTPTIEWYKDGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRRSKPDEGSY
50 60 70 80 90 100
150 160 170 180 190 200
pF1KE6 TCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWR
.:::::::: :.:::::::::.:::::::.: .::::.::::.::: ::::::::.. :.
CCDS43 VCVARNYLGEAVSRNASLEVALLRDDFRQNPTDVVVAAGEPAILECQPPRGHPEPTIYWK
110 120 130 140 150 160
210 220 230 240 250 260
pF1KE6 KDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFL
:: .:. ..: ::.:::::::.:.: :::::::.::..::.:::.: ::. :.:::.::
CCDS43 KDKVRIDDKEERISIRGGKLMISNTRKSDAGMYTCVGTNMVGERDSDPAELTVFERPTFL
170 180 190 200 210 220
270 280 290 300 310 320
pF1KE6 RRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDE
:::.::::: . : : :.:.::: : .::.:.:..:: :::.:..:..: : .. . ::
CCDS43 RRPINQVVLEEEAVEFRCQVQGDPQPTVRWKKDDADLPRGRYDIKDDYTLRIKKTMSTDE
230 240 250 260 270 280
330 340 350 360 370 380
pF1KE6 GTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIFWQ
::: :.::: ::. :::..:.:..:::.:..:.::..: :..:.: ::::::: ::.:::
CCDS43 GTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNPQPAVFWQ
290 300 310 320 330 340
390 400 410 420 430 440
pF1KE6 KEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALLEI
::::: ::::.: ::..: :::: :.:.:: .::.:::::.:::..::::::::: ::.
CCDS43 KEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGSILAKAQLEV
350 360 370 380 390 400
450 460 470 480 490 500
pF1KE6 KGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFKTM
. : ::.::::::::::.. ... : :..::.: : . : :.: . : : . .
CCDS43 TDVLTDRPPPIILQGPANQTLAVDGTALLKCKATGDPLPVISWLKEGFTFPGRDPRATIQ
410 420 430 440 450 460
510 520 530 540 550 560
pF1KE6 ANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPPTEPSSPPGAPSQ
.::: : :.. : : :.::: ::.::..::. : . :. :.. . . :. :: ::.
CCDS43 EQGTLQIKNLRISDTGTYTCVATSSSGETSWSAVLDVTES-GATISKNYDLSDLPGPPSK
470 480 490 500 510 520
570 580 590 600 610 620
pF1KE6 PVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVSGLQP
: ::..::::.::.:.:. ...:.::::: ...:.:.:::. :. .:: ::.:
CCDS43 PQVTDVTKNSVTLSWQPGTPGTLPASAYIIEAFSQSVSNSWQTVANHVKTTLYTVRGLRP
530 540 550 560 570 580
630 640 650 660 670 680
pF1KE6 NTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQEPIVL
::::::.:::.. :::.:::.:.:::::: :: : . :. :..: :::..:.::
CCDS43 NTIYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQGVDHRQVQKELGDVLVRLHNPVVL
590 600 610 620 630 640
690 700 710 720 730
pF1KE6 GPRTLQVSWTVDGPVQLVQGFRVSWR-VAGPEG-GSWTMLDLQSPSQQSTVLRGLPPGTQ
: :.::.:::: :..::.:: .: ..: .. .:: :: . :...:.:: .: :.
CCDS43 TPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSWQNLDAKVPTERSAVLVNLKKGVT
650 660 670 680 690 700
740 750 760 770 780 790
pF1KE6 IQIKVQAQGQEGLGAESLSVTRSIPEEAPSGPPQGVAVALGGDGNS-SITVSWEPPLPSQ
.:::. .: : .: : : :::::.:::.:.: :. :: ::.:::.:: :..
CCDS43 YEIKVRPYFNEFQGMDSESKTVRTTEEAPSAPPQSVTVLTVGSYNSTSISVSWDPPPPDH
710 720 730 740 750 760
800 810 820 830 840 850
pF1KE6 QNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGVGVPSA
:::.: ::.:::::::.:::.:... . ::... :: ::. ::. :::.::::::: :
CCDS43 QNGIIQEYKIWCLGNETRFHINKTVDAAIRSVIIGGLFPGIQYRVEVAASTSAGVGVKSE
770 780 790 800 810 820
860 870 880 890 900 910
pF1KE6 PVLVQLPSPPDLEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAALYWRRKQ
: . . .. : . ... ... :...:::.:: :.:: ..:.:. ::::::.
CCDS43 PQPIIIGRRNEVVI-TENNNSITEQITDVVKQPAFIAGIGGACWVILMGFSIWLYWRRKK
830 840 850 860 870 880
920 930 940 950 960 970
pF1KE6 RKELSHYTASFAYTPAVSFPHSEG-LSGASSRPPM-GLGPAPYSWLADSWPHPSR--SPS
:: ::.: ::.: ...: : . .::: . . : : ::::::: : . :
CCDS43 RKGLSNY--------AVTFQRGDGGLMSNGSRPGLLNAGDPSYPWLADSWPATSLPVNNS
890 900 910 920 930
980 990 1000 1010 1020
pF1KE6 AQEP-------RGSCCPSNPDPDDR---YYNEAGISLYLAQTARGTAAPGEGPVYSTIDP
. : ::. : : :. . ....: . :.. . . . .: :
CCDS43 NSGPNEIGNFGRGDVLPPVPGQGDKTATMLSDGAIYSSIDFTTKTSYNSSSQITQAT--P
940 950 960 970 980 990
1030 1040 1050 1060
pF1KE6 AGEELQTFHGGFPQHPSGDL-GP-WSQ------------YAPPEWSQGDSGAKGGKVKL-
. : .:.. .. . :: : :.. :. :. ..:..:.:::: :
CCDS43 YATT-QILHSNSIHELAVDLPDPQWKSSIQQKTDLMGFGYSLPDQNKGNNGGKGGKKKKN
1000 1010 1020 1030 1040 1050
1070 1080 1090 1100 1110 1120
pF1KE6 --LGKPVQMPSLNWPEA-LPPPP----PSCELSCLEGPEEELEGSSEPEEWCPPMPERSH
.:: . . .: .. ::::: :. :: . :. :.. . . ::::.: ...
CCDS43 KNSSKPQKNNGSTWANVPLPPPPVQPLPGTELE--HYAVEQQENGYDSDSWCPPLPVQTY
1060 1070 1080 1090 1100 1110
1130 1140 1150 1160 1170
pF1KE6 LTE------PSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPTDMPHLHQM
: . .. . : : . ::. :.:::::::::::: . :: . :: ..
CCDS43 LHQGLEDELEEDDDRVPTPPVRGVASSPAISFGQQSTATLTPSPREEMQPMLQA-HLDEL
1120 1130 1140 1150 1160 1170
1180 1190 1200 1210 1220 1230
pF1KE6 PRRVPLGPSSPL----SVSQPMLGIREARPAGLGAGPAASPHLSPSPAPSTASSAPGRTW
: . .. : .:: . : : .: : : . : . :..
CCDS43 TRAYQFDIAKQTWHIQSNNQPPQP--PVPPLGYVSGALISD-LETDVADDDADDE-----
1180 1190 1200 1210 1220
1240 1250 1260 1270 1280
pF1KE6 QGNGEMTPPL----QGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEEASWALELRAA
. :. :: : : . . . ... . .: . : : : ... . : .
CCDS43 EEALEIPRPLRALDQTPGSSMDNLDSSVTGKAFTS--SQRPRPTSPFSTDSNTSAALSQS
1230 1240 1250 1260 1270 1280
1290 1300 1310 1320 1330 1340
pF1KE6 GSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCSTAGSNS
.....:. :.: .: :::: .:::.::: : :..:
CCDS43 QRPRPTKKHKGGRMDQQPALP--HRREGMTDEEALVPYSKPSFPS----------PGGHS
1290 1300 1310 1320 1330
1350 1360 1370 1380
pF1KE6 SRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR
: :..::.:: :: ..
CCDS43 SSGTASSKGSTGPRKTEVLRAGHQRNASDLLDIGYMGSNSQGQFTGEL
1340 1350 1360 1370
>>CCDS54610.1 ROBO1 gene_id:6091|Hs108|chr3 (1551 aa)
initn: 3329 init1: 1413 opt: 3222 Z-score: 1396.5 bits: 271.0 E(32554): 1.8e-71
Smith-Waterman score: 3390; 44.8% identity (71.5% similar) in 1231 aa overlap (53-1219:18-1227)
30 40 50 60 70 80
pF1KE6 ISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPAT
.:::. :: :::::.: ::.::.:::::
CCDS54 MIAEPAHFYLFGLICLCSGSRLRQEDFPPRIVEHPSDLIVSKGEPAT
10 20 30 40
90 100 110 120 130 140
pF1KE6 LPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVYT
: :.::::: :.:::::.: :: : ..:::.::.:::::.::: ::::::..:::::::.
CCDS54 LNCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYV
50 60 70 80 90 100
150 160 170 180 190 200
pF1KE6 CVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWRK
:::::::: :.:.:::::::.:::::::.:..:.::::::::.:: ::::::::..::.:
CCDS54 CVARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKK
110 120 130 140 150 160
210 220 230 240 250 260
pF1KE6 DGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFLR
::. : ... ::::::::::...: ::::: ::::..::.::::: .::. :::::::..
CCDS54 DGSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVK
170 180 190 200 210 220
270 280 290 300 310 320
pF1KE6 RPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDEG
:: : .: .: . : ::..::: : .::::.::::: .:::::.::.: : .:.: : :
CCDS54 RPSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMG
230 240 250 260 270 280
330 340 350 360 370
pF1KE6 TYTCVAENSVGRAEASGSLSVHV---PPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIF
.::::::: ::.::::..:.:.: ::..:..:.::..: :..:.::::. ::: ::::
CCDS54 SYTCVAENMVGKAEASATLTVQVGSEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIF
290 300 310 320 330 340
380 390 400 410 420 430
pF1KE6 WQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALL
:..:::: ::: : : ..::::: :.:.:: :::.:.:::.::...:::::..:: :
CCDS54 WRREGSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYL
350 360 370 380 390 400
440 450 460 470 480 490
pF1KE6 EIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFK
:. . : :::: :::.:::... .. : : .::.: :.. :.::: .. .: ..:
CCDS54 EVTDVIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIK
410 420 430 440 450 460
500 510 520 530 540 550
pF1KE6 TMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPP--TEPSSPPG
. ::.: : .. : : :.:.:.. .::::::......: .:: .:: :.:. :.
CCDS54 QLENGVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQE-FGVPVQPPRPTDPNLIPS
470 480 490 500 510 520
560 570 580 590 600 610
pF1KE6 APSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVS
:::.: ::....:..::.:.:: ..::. :::.::::: :.:..:.:::..:. :: ...
CCDS54 APSKPEVTDVSRNTVTLSWQPNLNSGATPTSYIIEAFSHASGSSWQTVAENVKTETSAIK
530 540 550 560 570 580
620 630 640 650 660 670
pF1KE6 GLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQE
::.::.::::::::..:.:.:.:: .:.::.::: :. : . :. :......:..
CCDS54 GLKPNAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHN
590 600 610 620 630 640
680 690 700 710 720 730
pF1KE6 PIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGG--SWTMLDLQSPSQQSTVLRGLP
: ::. ...: :::: : .::... .: .: . : .: ......:...:.:. :
CCDS54 PTVLSSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLR
650 660 670 680 690 700
740 750 760 770 780 790
pF1KE6 PGTQIQIKVQAQGQEGLGAES-LSVTRSIPEEAPSGPPQGVAVALGGDGN-SSITVSWEP
:.. .::.. .: ::.: .. .... :::::.:::::.:. .::: ..: :::.:
CCDS54 KGVNYEIKARPFFNEFQGADSEIKFAKTL-EEAPSAPPQGVTVS-KNDGNGTAILVSWQP
710 720 730 740 750 760
800 810 820 830 840 850
pF1KE6 PLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGV
: . :::.. ::..::::::.:.:.:... : . :... ::::. : . :::.:.::
CCDS54 PPEDTQNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGS
770 780 790 800 810 820
860 870 880 890 900 910
pF1KE6 GVPSAPVLVQLPSPPD-LEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAAL
:: : : ..:: . . . : .: .:: ... :...:::.:: :::: .:. . :
CCDS54 GVKSEPQFIQLDAHGNPVSPEDQV--SLAQQISDVVKQPAFIAGIGAACWIILMVFSIWL
830 840 850 860 870 880
920 930 940 950 960 970
pF1KE6 YWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPM-GLG-PAPYSWLADSWPHPS
: .::.:. : :...: :.. .. ....:: . ... :: ::::.::. .
CCDS54 YRHRKKRNGL---TSTYAGIRKVTYQRGGEAVSSGGRPGLLNISEPAAQPWLADTWPNTG
890 900 910 920 930
980 990 1000 1010
pF1KE6 RSPSAQEPRGSCCPS---NPDPDDRYYNEAG-----ISLYLAQTA------RGTAAPGE-
. . . ::: . : : . :.. : . : :. :.. ::
CCDS54 NNHN--DCSISCCTAGNGNSDSNLTTYSRPGQPTPYATTQLIQSNLSNNMNNGSGDSGEK
940 950 960 970 980 990
1020 1030 1040 1050
pF1KE6 ------------GPVYSTIDPAGEELQTFHGG------FPQHPSGDLGPWSQYAPPEWSQ
.:: .: .. . .... .: . : : . ..: . ..
CCDS54 HWKPLGQQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYNQSYDQNTGGSYNSSDRGS
1000 1010 1020 1030 1040 1050
1060 1070 1080 1090 1100 1110
pF1KE6 GDSGAKGGKVKLLGKPVQMPS---LNWPEALPPPP--PSCELSCLEGPEEELEGSSEPEE
. ::..: : : : ..:. .:: . ::::: : . : : . .. : . :
CCDS54 STSGSQGHK-KGARTP-KVPKQGGMNWADLLPPPPAHPPPH-SNSEEYNISVDESYDQEM
1060 1070 1080 1090 1100 1110
1120 1130 1140 1150 1160
pF1KE6 WCPPMPERSHLT------EPSSSGGCLVTPSRRETPSPTP-SYGQQSTATLTPSPPDPPQ
:: : : .: : . : . : : . ::. ::..:::::::::: . :
CCDS54 PCPVPPARMYLQQDELEEEEDERGP--TPPVRGAASSPAAVSYSHQSTATLTPSPQEELQ
1120 1130 1140 1150 1160 1170
1170 1180 1190 1200 1210
pF1KE6 P-----PTDMPHLHQMP--RRVPLGPSSPLSVSQPMLGIREARPAGLGAGPAASPHLSPS
: : . :....: :: :..: : .: : . : .:: .: . .
CCDS54 PMLQDCPEETGHMQHQPDRRRQPVSPPPP---PRP---ISPPHTYGYISGPLVSDMDTDA
1180 1190 1200 1210 1220
1220 1230 1240 1250 1260 1270
pF1KE6 PAPSTASSAPGRTWQGNGEMTPPLQGPRARFRKKPKALPYRRENSPGDLPPPPLPPPEEE
:
CCDS54 PEEEEDEADMEVAKMQTRRLLLRGLEQTPASSVGDLESSVTGSMINGWGSASEEDNISSG
1230 1240 1250 1260 1270 1280
>>CCDS46872.2 ROBO1 gene_id:6091|Hs108|chr3 (1606 aa)
initn: 3329 init1: 1413 opt: 3217 Z-score: 1394.1 bits: 270.6 E(32554): 2.5e-71
Smith-Waterman score: 3339; 42.2% identity (69.1% similar) in 1380 aa overlap (53-1372:18-1351)
30 40 50 60 70 80
pF1KE6 ISNSSELLLGFNSSLAALNHTLLPPGDPSLNGSRVGPEDAMPRIVEQPPDLLVSRGEPAT
.:::. :: :::::.: ::.::.:::::
CCDS46 MIAEPAHFYLFGLICLCSGSRLRQEDFPPRIVEHPSDLIVSKGEPAT
10 20 30 40
90 100 110 120 130 140
pF1KE6 LPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARPDEGVYT
: :.::::: :.:::::.: :: : ..:::.::.:::::.::: ::::::..:::::::.
CCDS46 LNCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRPDEGVYV
50 60 70 80 90 100
150 160 170 180 190 200
pF1KE6 CVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEPSVSWRK
:::::::: :.:.:::::::.:::::::.:..:.::::::::.:: ::::::::..::.:
CCDS46 CVARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEPTISWKK
110 120 130 140 150 160
210 220 230 240 250 260
pF1KE6 DGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLERPSFLR
::. : ... ::::::::::...: ::::: ::::..::.::::: .::. :::::::..
CCDS46 DGSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLERPSFVK
170 180 190 200 210 220
270 280 290 300 310 320
pF1KE6 RPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHVSAEDEG
:: : .: .: . : ::..::: : .::::.::::: .:::::.::.: : .:.: : :
CCDS46 RPSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKVTAGDMG
230 240 250 260 270 280
330 340 350 360 370
pF1KE6 TYTCVAENSVGRAEASGSLSVHV---PPQLVTQPQDQMAAPGESVAFQCETKGNPPPAIF
.::::::: ::.::::..:.:.: ::..:..:.::..: :..:.::::. ::: ::::
CCDS46 SYTCVAENMVGKAEASATLTVQVGSEPPHFVVKPRDQVVALGRTVTFQCEATGNPQPAIF
290 300 310 320 330 340
380 390 400 410 420 430
pF1KE6 WQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAKALL
:..:::: ::: : : ..::::: :.:.:: :::.:.:::.::...:::::..:: :
CCDS46 WRREGSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITKAYL
350 360 370 380 390 400
440 450 460 470 480 490
pF1KE6 EIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDLQFK
:. . : :::: :::.:::... .. : : .::.: :.. :.::: .. .: ..:
CCDS46 EVTDVIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDSRIK
410 420 430 440 450 460
500 510 520 530 540 550
pF1KE6 TMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPP--TEPSSPPG
. ::.: : .. : : :.:.:.. .::::::......: .:: .:: :.:. :.
CCDS46 QLENGVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQE-FGVPVQPPRPTDPNLIPS
470 480 490 500 510 520
560 570 580 590 600 610
pF1KE6 APSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETHTVS
:::.: ::....:..::.:.:: ..::. :::.::::: :.:..:.:::..:. :: ...
CCDS46 APSKPEVTDVSRNTVTLSWQPNLNSGATPTSYIIEAFSHASGSSWQTVAENVKTETSAIK
530 540 550 560 570 580
620 630 640 650 660 670
pF1KE6 GLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVRLQE
::.::.::::::::..:.:.:.:: .:.::.::: :. : . :. :......:..
CCDS46 GLKPNAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLHLHN
590 600 610 620 630 640
680 690 700 710 720 730
pF1KE6 PIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGG--SWTMLDLQSPSQQSTVLRGLP
: ::. ...: :::: : .::... .: .: . : .: ......:...:.:. :
CCDS46 PTVLSSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIPDLR
650 660 670 680 690 700
740 750 760 770 780 790
pF1KE6 PGTQIQIKVQAQGQEGLGAES-LSVTRSIPEEAPSGPPQGVAVALGGDGN-SSITVSWEP
:.. .::.. .: ::.: .. .... :::::.:::::.:. .::: ..: :::.:
CCDS46 KGVNYEIKARPFFNEFQGADSEIKFAKTL-EEAPSAPPQGVTVS-KNDGNGTAILVSWQP
710 720 730 740 750 760
800 810 820 830 840 850
pF1KE6 PLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATSAGV
: . :::.. ::..::::::.:.:.:... : . :... ::::. : . :::.:.::
CCDS46 PPEDTQNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTGAGS
770 780 790 800 810 820
860 870 880 890 900 910
pF1KE6 GVPSAPVLVQLPSPPD-LEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLCAAL
:: : : ..:: . . . : .:. :: ... :...:::.:: :::: .:. . :
CCDS46 GVKSEPQFIQLDAHGNPVSPEDQVS--LAQQISDVVKQPAFIAGIGAACWIILMVFSIWL
830 840 850 860 870 880
920 930 940 950 960 970
pF1KE6 YWRRKQRKELSHYTASFAYTPAVSFPHSEGLSGASSRPPM-GLG-PAPYSWLADSWPHPS
: .::.:. : :...: :.. .. ....:: . ... :: ::::.::. .
CCDS46 YRHRKKRNGL---TSTYAGIRKVTYQRGGEAVSSGGRPGLLNISEPAAQPWLADTWPNTG
890 900 910 920 930
980 990 1000 1010 1020
pF1KE6 RSPSAQEPRGSCCPS---NPDPDDRYYNE-----AGISLYLAQTARGTAAPGEGPVYSTI
. . . ::: . : : . :.. :. . : . . : :. ::. .
CCDS46 NNHN--DCSISCCTAGNGNSDSNLTTYSRPADCIANYNNQLDNKQTNLMLP-ESTVYGDV
940 950 960 970 980 990
1030 1040 1050 1060
pF1KE6 DPAGE--ELQTFHG-----GFPQHPSGDLGPW--SQYAPPEWSQ------GDSGAKG---
: ... :..::.. : .:::. :. .: . :. :::: :
CCDS46 DLSNKINEMKTFNSPNLKDGRFVNPSGQPTPYATTQLIQSNLSNNMNNGSGDSGEKHWKP
1000 1010 1020 1030 1040 1050
1070 1080 1090 1100 1110
pF1KE6 -GKVKLLGKPVQMP-----SLNWP-EALPPPPPSCELSCLEGPEEELEGSSEPEEWCPPM
:. : :::. .:: .: ::. . .. ... :: . .
CCDS46 LGQQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYN--QSYDQNTGGSYNSSD-----
1060 1070 1080 1090 1100
1120 1130 1140 1150 1160
pF1KE6 PERSHLTEPSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPT---------
. ::..: . .::. .:. : .. : : : :: : : .
CCDS46 -------RGSSTSGSQGHKKGARTPK-VPKQGGMNWADLLPPPPAHPPPHSNSEEYNISV
1110 1120 1130 1140 1150 1160
1170 1180 1190 1200 1210 1220
pF1KE6 DMPHLHQMPRRVPLGPSSPLSVSQPMLGIREAR--PAGLGAGPAASPHLSPSPAPSTASS
: . ..:: :. :. . ..: : .: . :. : :.:: :::.
CCDS46 DESYDQEMP--CPVPPAR-MYLQQDELEEEEDERGPTPPVRGAASSPAAVSYSHQSTATL
1170 1180 1190 1200 1210
1230 1240 1250 1260 1270 1280
pF1KE6 APGRTWQGNGEMTPPLQG-PRARFRKKPKALPYRRENSPGDLPPPPLP--PPEEEASWAL
.: . . :. : :: :. . . . : ::.. : . :::: : ::. . .
CCDS46 TP----SPQEELQPMLQDCPEETGHMQHQ--PDRRRQ-PVSPPPPPRPISPPHTYGYISG
1220 1230 1240 1250 1260 1270
1290 1300 1310 1320 1330 1340
pF1KE6 ELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSRGQGTSTCST
: ...:.. :. .. .... . ..:.: : : : : :. : :.
CCDS46 PL--VSDMDTDAPEEEEDEADMEVAKMQTRRLLLRGLEQ-TPAS-----SVGDLES--SV
1280 1290 1300 1310 1320
1350 1360 1370 1380
pF1KE6 AGSN-SSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR
.:: .. ::.: . . . ::: :.. :
CCDS46 TGSMINGWGSASEEDNISSGRSSVSSSDGSFFTDADFAQAVAAAAEYAGLKVARRQMQDA
1330 1340 1350 1360 1370 1380
>>CCDS54611.1 ROBO1 gene_id:6091|Hs108|chr3 (1651 aa)
initn: 3382 init1: 2089 opt: 3194 Z-score: 1384.1 bits: 268.8 E(32554): 8.9e-71
Smith-Waterman score: 3367; 42.3% identity (69.1% similar) in 1389 aa overlap (49-1372:51-1396)
20 30 40 50 60 70
pF1KE6 LAGDISNSSELLLGFNSSLAALNHTLLPPGDPSLN--GSRVGPEDAMPRIVEQPPDLLVS
: ::. :::. :: :::::.: ::.::
CCDS54 HLFLAQLIPDPEDVERGNDHGTPIPTSDNDDNSLGYTGSRLRQEDFPPRIVEHPSDLIVS
30 40 50 60 70 80
80 90 100 110 120 130
pF1KE6 RGEPATLPCRAEGRPRPNIEWYKNGARVATVREDPRAHRLLLPSGALFFPRIVHGRRARP
.:::::: :.::::: :.:::::.: :: : ..:::.::.:::::.::: ::::::..::
CCDS54 KGEPATLNCKAEGRPTPTIEWYKGGERVETDKDDPRSHRMLLPSGSLFFLRIVHGRKSRP
90 100 110 120 130 140
140 150 160 170 180 190
pF1KE6 DEGVYTCVARNYLGAAASRNASLEVAVLRDDFRQSPGNVVVAVGEPAVLECVPPRGHPEP
:::::.:::::::: :.:.:::::::.:::::::.:..:.::::::::.:: ::::::::
CCDS54 DEGVYVCVARNYLGEAVSHNASLEVAILRDDFRQNPSDVMVAVGEPAVMECQPPRGHPEP
150 160 170 180 190 200
200 210 220 230 240 250
pF1KE6 SVSWRKDGARLKEEEGRITIRGGKLMMSHTLKSDAGMYVCVASNMAGERESAAAEVMVLE
..::.:::. : ... ::::::::::...: ::::: ::::..::.::::: .::. :::
CCDS54 TISWKKDGSPLDDKDERITIRGGKLMITYTRKSDAGKYVCVGTNMVGERESEVAELTVLE
210 220 230 240 250 260
260 270 280 290 300 310
pF1KE6 RPSFLRRPVNQVVLADAPVTFLCEVKGDPPPRLRWRKEDGELPTGRYEIRSDHSLWIGHV
::::..:: : .: .: . : ::..::: : .::::.::::: .:::::.::.: : .:
CCDS54 RPSFVKRPSNLAVTVDDSAEFKCEARGDPVPTVRWRKDDGELPKSRYEIRDDHTLKIRKV
270 280 290 300 310 320
320 330 340 350 360 370
pF1KE6 SAEDEGTYTCVAENSVGRAEASGSLSVHVPPQLVTQPQDQMAAPGESVAFQCETKGNPPP
.: : :.::::::: ::.::::..:.:. ::..:..:.::..: :..:.::::. ::: :
CCDS54 TAGDMGSYTCVAENMVGKAEASATLTVQEPPHFVVKPRDQVVALGRTVTFQCEATGNPQP
330 340 350 360 370 380
380 390 400 410 420 430
pF1KE6 AIFWQKEGSQVLLFPSQSLQPTGRFSVSPRGQLNITAVQRGDAGYYVCQAVSVAGSILAK
::::..:::: ::: : : ..::::: :.:.:: :::.:.:::.::...:::::..:
CCDS54 AIFWRREGSQNLLFSYQPPQSSSRFSVSQTGDLTITNVQRSDVGYYICQTLNVAGSIITK
390 400 410 420 430 440
440 450 460 470 480 490
pF1KE6 ALLEIKGASLDGLPPVILQGPANQTLVLGSSVWLPCRVTGNPQPSVRWKKDGQWLQGDDL
: ::. . : :::: :::.:::... .. : : .::.: :.. :.::: .. .:
CCDS54 AYLEVTDVIADRPPPVIRQGPVNQTVAVDGTFVLSCVATGSPVPTILWRKDGVLVSTQDS
450 460 470 480 490 500
500 510 520 530 540 550
pF1KE6 QFKTMANGTLYIANVQEMDMGFYSCVAKSSTGEATWSGWLKMREDWGVSPDPP--TEPSS
..: . ::.: : .. : : :.:.:.. .::::::......: .:: .:: :.:.
CCDS54 RIKQLENGVLQIRYAKLGDTGRYTCIASTPSGEATWSAYIEVQE-FGVPVQPPRPTDPNL
510 520 530 540 550
560 570 580 590 600 610
pF1KE6 PPGAPSQPVVTEITKNSITLTWKPNPQTGAAVTSYVIEAFSPAAGNTWRTVADGVQLETH
:.:::.: ::....:..::.:.:: ..::. :::.::::: :.:..:.:::..:. ::
CCDS54 IPSAPSKPEVTDVSRNTVTLSWQPNLNSGATPTSYIIEAFSHASGSSWQTVAENVKTETS
560 570 580 590 600 610
620 630 640 650 660 670
pF1KE6 TVSGLQPNTIYLFLVRAVGAWGLSEPSPVSEPVRTQDSSPSRPVEDPWRGQQGLAEVAVR
...::.::.::::::::..:.:.:.:: .:.::.::: :. : . :. :......
CCDS54 AIKGLKPNAIYLFLVRAANAYGISDPSQISDPVKTQDVLPTSQGVDHKQVQRELGNAVLH
620 630 640 650 660 670
680 690 700 710 720 730
pF1KE6 LQEPIVLGPRTLQVSWTVDGPVQLVQGFRVSWRVAGPEGG--SWTMLDLQSPSQQSTVLR
:..: ::. ...: :::: : .::... .: .: . : .: ......:...:.:.
CCDS54 LHNPTVLSSSSIEVHWTVDQQSQYIQGYKILYRPSGANHGESDWLVFEVRTPAKNSVVIP
680 690 700 710 720 730
740 750 760 770 780 790
pF1KE6 GLPPGTQIQIKVQAQGQEGLGAES-LSVTRSIPEEAPSGPPQGVAVALGGDGN-SSITVS
: :.. .::.. .: ::.: .. .... :::::.:::::.:. .::: ..: ::
CCDS54 DLRKGVNYEIKARPFFNEFQGADSEIKFAKTL-EEAPSAPPQGVTVS-KNDGNGTAILVS
740 750 760 770 780 790
800 810 820 830 840 850
pF1KE6 WEPPLPSQQNGVITEYQIWCLGNESRFHLNRSAAGWARSAMLRGLVPGLLYRTLVAAATS
:.:: . :::.. ::..::::::.:.:.:... : . :... ::::. : . :::.:.
CCDS54 WQPPPEDTQNGMVQEYKVWCLGNETRYHINKTVDGSTFSVVIPFLVPGIRYSVEVAASTG
800 810 820 830 840 850
860 870 880 890 900
pF1KE6 AGVGVPSAPVLVQLPSPPD-LEPGLEVGAGLAVRLARVLREPAFLAGSGAACGALLLGLC
:: :: : : ..:: . . . : : ..:: ... :...:::.:: :::: .:. .
CCDS54 AGSGVKSEPQFIQLDAHGNPVSP--EDQVSLAQQISDVVKQPAFIAGIGAACWIILMVFS
860 870 880 890 900 910
910 920 930 940 950 960
pF1KE6 AALYWRRKQRKELSHYTA------SFAYTPAVSFPHSEGLSGASSRPPM-GLG-PAPYSW
:: .::.:. :. : ::..::.:.. .. ....:: . ... :: :
CCDS54 IWLYRHRKKRNGLTSTYAGIRKVPSFTFTPTVTYQRGGEAVSSGGRPGLLNISEPAAQPW
920 930 940 950 960 970
970 980 990 1000 1010
pF1KE6 LADSWPHPSRSPSAQEPRGSCCPS---NPDPDDRYYNE-----AGISLYLAQTARGTAAP
:::.::. . . . . ::: . : : . :.. :. . : . . :
CCDS54 LADTWPNTGNNHN--DCSISCCTAGNGNSDSNLTTYSRPADCIANYNNQLDNKQTNLMLP
980 990 1000 1010 1020 1030
1020 1030 1040 1050
pF1KE6 GEGPVYSTIDPAGE--ELQTFHG-----GFPQHPSGDLGPW--SQYAPPEWSQ------G
:. ::. .: ... :..::.. : .:::. :. .: . :. :
CCDS54 -ESTVYGDVDLSNKINEMKTFNSPNLKDGRFVNPSGQPTPYATTQLIQSNLSNNMNNGSG
1040 1050 1060 1070 1080 1090
1060 1070 1080 1090 1100
pF1KE6 DSGAKG----GKVKLLGKPVQMP-----SLNWP-EALPPPPPSCELSCLEGPEEELEGSS
::: : :. : :::. .:: .: ::. . .. ... ::
CCDS54 DSGEKHWKPLGQQKQEVAPVQYNIVEQNKLNKDYRANDTVPPTIPYN--QSYDQNTGGSY
1100 1110 1120 1130 1140 1150
1110 1120 1130 1140 1150 1160
pF1KE6 EPEEWCPPMPERSHLTEPSSSGGCLVTPSRRETPSPTPSYGQQSTATLTPSPPDPPQPPT
. . . ::..: . .::. .:. : .. : : : :: : : .
CCDS54 NSSD------------RGSSTSGSQGHKKGARTPK-VPKQGGMNWADLLPPPPAHPPPHS
1160 1170 1180 1190
1170 1180 1190 1200 1210
pF1KE6 ---------DMPHLHQMPRRVPLGPSSPLSVSQPMLGIREAR--PAGLGAGPAASPHLSP
: . ..:: :. :. . ..: : .: . :. : :.::
CCDS54 NSEEYNISVDESYDQEMP--CPVPPAR-MYLQQDELEEEEDERGPTPPVRGAASSPAAVS
1200 1210 1220 1230 1240 1250
1220 1230 1240 1250 1260 1270
pF1KE6 SPAPSTASSAPGRTWQGNGEMTPPLQG-PRARFRKKPKALPYRRENSPGDLPPPPLP--P
:::. .:. . :. : :: :. . . . : ::.. : . :::: : :
CCDS54 YSHQSTATLTPS----PQEELQPMLQDCPEETGHMQHQ--PDRRRQ-PVSPPPPPRPISP
1260 1270 1280 1290 1300
1280 1290 1300 1310 1320 1330
pF1KE6 PEEEASWALELRAAGSMSSLERERSGERKAVQAVPLAAQRVLHPDEEAWLPYSRPSFLSR
:. . . : ...:.. :. .. .... . ..:.: : : : :
CCDS54 PHTYGYISGPL--VSDMDTDAPEEEEDEADMEVAKMQTRRLLLRGLEQ-TPAS-----SV
1310 1320 1330 1340 1350
1340 1350 1360 1370 1380
pF1KE6 GQGTSTCSTAGSN-SSRGSSSSRGSRGPGRSRSRSQSRSQSQRPGQKRREEPR
:. : :..:: .. ::.: . . . ::: :.. :
CCDS54 GDLES--SVTGSMINGWGSASEEDNISSGRSSVSSSDGSFFTDADFAQAVAAAAEYAGLK
1360 1370 1380 1390 1400 1410
CCDS54 VARRQMQDAAGRRHFHASQCPRPTSPVSTDSNMSAAVMQKTRPAKKLKHQPGHLRRETYT
1420 1430 1440 1450 1460 1470
1386 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 15:48:45 2016 done: Tue Nov 8 15:48:46 2016
Total Scan time: 6.210 Total Display time: 0.550
Function used was FASTA [36.3.4 Apr, 2011]