FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4595, 1241 aa 1>>>pF1KE4595 1241 - 1241 aa - 1241 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.0216+/-0.00114; mu= 9.9705+/- 0.068 mean_var=208.4752+/-43.730, 0's: 0 Z-trim(109.1): 143 B-trim: 112 in 1/51 Lambda= 0.088827 statistics sampled from 10481 (10634) to 10481 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.667), E-opt: 0.2 (0.327), width: 16 Scan time: 5.030 The best scores are: opt bits E(32554) CCDS32996.1 NPHS1 gene_id:4868|Hs108|chr19 (1241) 8359 1085.6 0 CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378) 461 73.5 4.1e-12 CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394) 461 73.5 4.1e-12 >>CCDS32996.1 NPHS1 gene_id:4868|Hs108|chr19 (1241 aa) initn: 8359 init1: 8359 opt: 8359 Z-score: 5801.6 bits: 1085.6 E(32554): 0 Smith-Waterman score: 8359; 100.0% identity (100.0% similar) in 1241 aa overlap (1-1241:1-1241) 10 20 30 40 50 60 pF1KE4 MALGTTLRASLLLLGLLTEGLAQLAIPASVPRGFWALPENLTVVEGASVELRCGVSTPGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MALGTTLRASLLLLGLLTEGLAQLAIPASVPRGFWALPENLTVVEGASVELRCGVSTPGS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 AVQWAKDGLLLGPDPRIPGFPRYRLEGDPARGEFHLHIEACDLSDDAEYECQVGRSEMGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 AVQWAKDGLLLGPDPRIPGFPRYRLEGDPARGEFHLHIEACDLSDDAEYECQVGRSEMGP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 ELVSPRVILSILVPPKLLLLTPEAGTMVTWVAGQEYVVNCVSGDAKPAPDITILLSGQTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ELVSPRVILSILVPPKLLLLTPEAGTMVTWVAGQEYVVNCVSGDAKPAPDITILLSGQTI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 SDISANVNEGSQQKLFTVEATARVTPRSSDNRQLLVCEASSPALEAPIKASFTVNVLFPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SDISANVNEGSQQKLFTVEATARVTPRSSDNRQLLVCEASSPALEAPIKASFTVNVLFPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GPPVIEWPGLDEGHVRAGQSLELPCVARGGNPLATLQWLKNGQPVSTAWGTEHTQAVARS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GPPVIEWPGLDEGHVRAGQSLELPCVARGGNPLATLQWLKNGQPVSTAWGTEHTQAVARS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 VLVMTVRPEDHGAQLSCEAHNSVSAGTQEHGITLQVTFPPSAIIILGSASQTENKNVTLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VLVMTVRPEDHGAQLSCEAHNSVSAGTQEHGITLQVTFPPSAIIILGSASQTENKNVTLS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 CVSKSSRPRVLLRWWLGWRQLLPMEETVMDGLHGGHISMSNLTFLARREDNGLTLTCEAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CVSKSSRPRVLLRWWLGWRQLLPMEETVMDGLHGGHISMSNLTFLARREDNGLTLTCEAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SEAFTKETFKKSLILNVKYPAQKLWIEGPPEGQKLRAGTRVRLVCLAIGGNPEPSLMWYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SEAFTKETFKKSLILNVKYPAQKLWIEGPPEGQKLRAGTRVRLVCLAIGGNPEPSLMWYK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 DSRTVTESRLPQESRRVHLGSVEKSGSTFSRELVLVTGPSDNQAKFTCKAGQLSASTQLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DSRTVTESRLPQESRRVHLGSVEKSGSTFSRELVLVTGPSDNQAKFTCKAGQLSASTQLA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 VQFPPTNVTILANASALRPGDALNLTCVSVSSNPPVNLSWDKEGERLEGVAAPPRRAPFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VQFPPTNVTILANASALRPGDALNLTCVSVSSNPPVNLSWDKEGERLEGVAAPPRRAPFK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 GSAAARSVLLQVSSRDHGQRVTCRAHSAELRETVSSFYRLNVLYRPEFLGEQVLVVTAVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GSAAARSVLLQVSSRDHGQRVTCRAHSAELRETVSSFYRLNVLYRPEFLGEQVLVVTAVE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 QGEALLPVSVSANPAPEAFNWTFRGYRLSPAGGPRHRILSSGALHLWNVTRADDGLYQLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QGEALLPVSVSANPAPEAFNWTFRGYRLSPAGGPRHRILSSGALHLWNVTRADDGLYQLH 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 CQNSEGTAEARLRLDVHYAPTIRALQDPTEVNVGGSVDIVCTVDANPILPGMFNWERLGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CQNSEGTAEARLRLDVHYAPTIRALQDPTEVNVGGSVDIVCTVDANPILPGMFNWERLGE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 DEEDQSLDDMEKISRGPTGRLRIHHAKLAQAGAYQCIVDNGVAPPARRLLRLVVRFAPQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DEEDQSLDDMEKISRGPTGRLRIHHAKLAQAGAYQCIVDNGVAPPARRLLRLVVRFAPQV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 EHPTPLTKVAAAGDSTSSATLHCRARGVPNIVFTWTKNGVPLDLQDPRYTEHTYHQGGVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EHPTPLTKVAAAGDSTSSATLHCRARGVPNIVFTWTKNGVPLDLQDPRYTEHTYHQGGVH 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 SSLLTIANVSAAQDYALFTCTATNALGSDQTNIQLVSISRPDPPSGLKVVSLTPHSVGLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SSLLTIANVSAAQDYALFTCTATNALGSDQTNIQLVSISRPDPPSGLKVVSLTPHSVGLE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 WKPGFDGGLPQRFCIRYEALGTPGFHYVDVVPPQATTFTLTGLQPSTRYRVWLLASNALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 WKPGFDGGLPQRFCIRYEALGTPGFHYVDVVPPQATTFTLTGLQPSTRYRVWLLASNALG 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE4 DSGLADKGTQLPITTPGLHQPSGEPEDQLPTEPPSGPSGLPLLPVLFALGGLLLLSNASC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DSGLADKGTQLPITTPGLHQPSGEPEDQLPTEPPSGPSGLPLLPVLFALGGLLLLSNASC 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE4 VGGVLWQRRLRRLAEGISEKTEAGSEEDRVRNEYEESQWTGERDTQSSTVSTTEAEPYYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VGGVLWQRRLRRLAEGISEKTEAGSEEDRVRNEYEESQWTGERDTQSSTVSTTEAEPYYR 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE4 SLRDFSPQLPPTQEEVSYSRGFTGEDEDMAFPGHLYDEVERTYPPSGAWGPLYDEVQMGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 SLRDFSPQLPPTQEEVSYSRGFTGEDEDMAFPGHLYDEVERTYPPSGAWGPLYDEVQMGP 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 pF1KE4 WDLHWPEDTYQDPRGIYDQVAGDLDTLEPDSLPFELRGHLV ::::::::::::::::::::::::::::::::::::::::: CCDS32 WDLHWPEDTYQDPRGIYDQVAGDLDTLEPDSLPFELRGHLV 1210 1220 1230 1240 >>CCDS43109.1 ROBO2 gene_id:6092|Hs108|chr3 (1378 aa) initn: 255 init1: 106 opt: 461 Z-score: 330.9 bits: 73.5 E(32554): 4.1e-12 Smith-Waterman score: 500; 25.7% identity (52.1% similar) in 639 aa overlap (450-1052:37-633) 420 430 440 450 460 470 pF1KE4 FSEAFTKETFKKSLILNVKYPAQKLWIEGPPEGQKLRAGTRVRLVCLAIGGNPEPSLMWY : . : . : : : : : :.. :: CCDS43 TQLLLCGFLYVRVDGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKA-EGRPTPTIEWY 10 20 30 40 50 60 480 490 500 510 520 530 pF1KE4 KDSRTVTESRLPQESRRVHLGSVEKSGSTFSRELVLVTGPSDNQAKFTCKA----GQL-- ::.. : .. .:.:. : ::: : ..: . ......: : :. CCDS43 KDGERVETDKDDPRSHRMLL----PSGSLFFLRIVHGRRSKPDEGSYVCVARNYLGEAVS 70 80 90 100 110 120 540 550 560 570 580 pF1KE4 -SASTQLAV---QF--PPTNVTILANASALRPGDALNLTCVSVSSNPPVNLSWDKEGERL .:: ..:. .: ::.:.. :. :. : : ..: .. : :. :. CCDS43 RNASLEVALLRDDFRQNPTDVVVAAGEPAI-------LECQPPRGHPEPTIYWKKDKVRI 130 140 150 160 170 590 600 610 620 630 640 pF1KE4 EGVAAPPRRAPFKGSAAARSVLLQVSSRDHGQRVTCRAHSAELRETVSSFYRLNVLYRPE . .: ..:. ..... . .. . :: . . . : :. .:.:. :: CCDS43 DD---KEERISIRGG----KLMISNTRKSDAGMYTC-VGTNMVGERDSDPAELTVFERPT 180 190 200 210 220 650 660 670 680 690 700 pF1KE4 FLGEQVLVVTAVEQGEALLPVSVSANPAPEAFNWTFRGYRLSPAGGPRHRILSSGALHLW :: . . :. .:. . . .:...: : . : : : : :. : .. .:.. CCDS43 FLRRPINQVV-LEEEAVEFRCQVQGDPQPTV-RWKKDDADL-PRG--RYDIKDDYTLRIK 230 240 250 260 270 280 710 720 730 740 750 760 pF1KE4 NVTRADDGLYQLHCQNSEGTAEARLRLDVHYAPTIRALQDPTEVNVGGSVDIVCTVDANP .. .:.: :. .: : :: : :. : . . : : .: . : . .:: CCDS43 KTMSTDEGTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNP 290 300 310 320 330 340 770 780 790 800 810 820 pF1KE4 ILPGMFNWERLGEDE---EDQSLDDMEKISRGPTGRLRIHHAKLAQAGAYQC----IVDN :..: :.. : .. .: . . : .::: : : . . ..:: : : .. . CCDS43 -QPAVF-WQKEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGS 350 360 370 380 390 830 840 850 860 870 880 pF1KE4 GVAPPARRLLRLVVRFAPQVEHPTPLTKVAAAGDSTSSATLHCRARGVPNIVFTWTKNGV .: .. ... : . : ... :. :.: : :.:.: : : :..: :.: CCDS43 ILAKAQLEVTDVLTDRPPPIILQGPANQTLAV-DGT--ALLKCKATGDPLPVISWLKEGF 400 410 420 430 440 450 890 900 910 920 930 pF1KE4 PLDLQDPRYTEHTYHQGGVHSSLLTIANVSAAQDYALFTCTATNALGSDQTNIQL----- . .::: : .:: : : :. . : . .::.::.. : . . : CCDS43 TFPGRDPRAT--IQEQG-----TLQIKNLRIS-DTGTYTCVATSSSGETSWSAVLDVTES 460 470 480 490 500 940 950 960 970 980 pF1KE4 -VSISR-------PDPPSGLKVVSLTPHSVGLEWKPGFDGGLPQRFCIRYEALGTPGFHY ..::. : ::: .:...: .:: : :.:: : :: : ::.. . CCDS43 GATISKNYDLSDLPGPPSKPQVTDVTKNSVTLSWQPGTPGTLPASAYI-IEAFSQSVSNS 510 520 530 540 550 560 990 1000 1010 1020 1030 1040 pF1KE4 VDVVPP--QATTFTLTGLQPSTRYRVWLLASNALGDSGLADKGTQL-PITTPGLHQPS-G ..: ..: .:. ::.:.: ..:. :.. .::.: . . :. : . :. : CCDS43 WQTVANHVKTTLYTVRGLRPNT---IYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQG 570 580 590 600 610 620 1050 1060 1070 1080 1090 1100 pF1KE4 EPEDQLPTEPPSGPSGLPLLPVLFALGGLLLLSNASCVGGVLWQRRLRRLAEGISEKTEA . :. : CCDS43 VDHRQVQKELGDVLVRLHNPVVLTPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSW 630 640 650 660 670 680 >>CCDS54609.1 ROBO2 gene_id:6092|Hs108|chr3 (1394 aa) initn: 221 init1: 106 opt: 461 Z-score: 330.9 bits: 73.5 E(32554): 4.1e-12 Smith-Waterman score: 500; 25.7% identity (52.1% similar) in 639 aa overlap (450-1052:53-649) 420 430 440 450 460 470 pF1KE4 FSEAFTKETFKKSLILNVKYPAQKLWIEGPPEGQKLRAGTRVRLVCLAIGGNPEPSLMWY : . : . : : : : : :.. :: CCDS54 TVVFWGHQGNGQGQGSRLRQEDFPPRIVEHPSDVIVSKGEPTTLNCKA-EGRPTPTIEWY 30 40 50 60 70 80 480 490 500 510 520 530 pF1KE4 KDSRTVTESRLPQESRRVHLGSVEKSGSTFSRELVLVTGPSDNQAKFTCKA----GQL-- ::.. : .. .:.:. : ::: : ..: . ......: : :. CCDS54 KDGERVETDKDDPRSHRMLL----PSGSLFFLRIVHGRRSKPDEGSYVCVARNYLGEAVS 90 100 110 120 130 540 550 560 570 580 pF1KE4 -SASTQLAV---QF--PPTNVTILANASALRPGDALNLTCVSVSSNPPVNLSWDKEGERL .:: ..:. .: ::.:.. :. :. : : ..: .. : :. :. CCDS54 RNASLEVALLRDDFRQNPTDVVVAAGEPAI-------LECQPPRGHPEPTIYWKKDKVRI 140 150 160 170 180 190 590 600 610 620 630 640 pF1KE4 EGVAAPPRRAPFKGSAAARSVLLQVSSRDHGQRVTCRAHSAELRETVSSFYRLNVLYRPE . .: ..:. ..... . .. . :: . . . : :. .:.:. :: CCDS54 DD---KEERISIRGG----KLMISNTRKSDAGMYTC-VGTNMVGERDSDPAELTVFERPT 200 210 220 230 240 650 660 670 680 690 700 pF1KE4 FLGEQVLVVTAVEQGEALLPVSVSANPAPEAFNWTFRGYRLSPAGGPRHRILSSGALHLW :: . . :. .:. . . .:...: : . : : : : :. : .. .:.. CCDS54 FLRRPINQVV-LEEEAVEFRCQVQGDPQPTV-RWKKDDADL-PRG--RYDIKDDYTLRIK 250 260 270 280 290 710 720 730 740 750 760 pF1KE4 NVTRADDGLYQLHCQNSEGTAEARLRLDVHYAPTIRALQDPTEVNVGGSVDIVCTVDANP .. .:.: :. .: : :: : :. : . . : : .: . : . .:: CCDS54 KTMSTDEGTYMCIAENRVGKMEASATLTVRAPPQFVVRPRDQIVAQGRTVTFPCETKGNP 300 310 320 330 340 350 770 780 790 800 810 820 pF1KE4 ILPGMFNWERLGEDE---EDQSLDDMEKISRGPTGRLRIHHAKLAQAGAYQC----IVDN :..: :.. : .. .: . . : .::: : : . . ..:: : : .. . CCDS54 -QPAVF-WQKEGSQNLLFPNQPQQPNSRCSVSPTGDLTITNIQRSDAGYYICQALTVAGS 360 370 380 390 400 410 830 840 850 860 870 880 pF1KE4 GVAPPARRLLRLVVRFAPQVEHPTPLTKVAAAGDSTSSATLHCRARGVPNIVFTWTKNGV .: .. ... : . : ... :. :.: : :.:.: : : :..: :.: CCDS54 ILAKAQLEVTDVLTDRPPPIILQGPANQTLAV-DGT--ALLKCKATGDPLPVISWLKEGF 420 430 440 450 460 470 890 900 910 920 930 pF1KE4 PLDLQDPRYTEHTYHQGGVHSSLLTIANVSAAQDYALFTCTATNALGSDQTNIQL----- . .::: : .:: : : :. . : . .::.::.. : . . : CCDS54 TFPGRDPRAT--IQEQG-----TLQIKNLRIS-DTGTYTCVATSSSGETSWSAVLDVTES 480 490 500 510 520 940 950 960 970 980 pF1KE4 -VSISR-------PDPPSGLKVVSLTPHSVGLEWKPGFDGGLPQRFCIRYEALGTPGFHY ..::. : ::: .:...: .:: : :.:: : :: : ::.. . CCDS54 GATISKNYDLSDLPGPPSKPQVTDVTKNSVTLSWQPGTPGTLPASAYI-IEAFSQSVSNS 530 540 550 560 570 580 990 1000 1010 1020 1030 1040 pF1KE4 VDVVPP--QATTFTLTGLQPSTRYRVWLLASNALGDSGLADKGTQL-PITTPGLHQPS-G ..: ..: .:. ::.:.: ..:. :.. .::.: . . :. : . :. : CCDS54 WQTVANHVKTTLYTVRGLRPNT---IYLFMVRAINPQGLSDPSPMSDPVRTQDISPPAQG 590 600 610 620 630 640 1050 1060 1070 1080 1090 1100 pF1KE4 EPEDQLPTEPPSGPSGLPLLPVLFALGGLLLLSNASCVGGVLWQRRLRRLAEGISEKTEA . :. : CCDS54 VDHRQVQKELGDVLVRLHNPVVLTPTTVQVTWTVDRQPQFIQGYRVMYRQTSGLQATSSW 650 660 670 680 690 700 1241 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 23:43:03 2016 done: Sat Nov 5 23:43:04 2016 Total Scan time: 5.030 Total Display time: 0.130 Function used was FASTA [36.3.4 Apr, 2011]