FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4514, 1620 aa
1>>>pF1KB4514 1620 - 1620 aa - 1620 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.1133+/-0.00109; mu= 7.6797+/- 0.065
mean_var=352.1804+/-81.869, 0's: 0 Z-trim(111.9): 361 B-trim: 0 in 0/53
Lambda= 0.068343
statistics sampled from 12347 (12790) to 12347 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.393), width: 16
Scan time: 5.830
The best scores are: opt bits E(32554)
CCDS33172.1 ALK gene_id:238|Hs108|chr2 (1620) 11178 1118.2 0
CCDS10077.1 LTK gene_id:4058|Hs108|chr15 ( 864) 2626 274.7 9.4e-73
CCDS10078.1 LTK gene_id:4058|Hs108|chr15 ( 803) 2142 226.9 2.1e-58
CCDS45237.1 LTK gene_id:4058|Hs108|chr15 ( 734) 1510 164.6 1.1e-39
CCDS5116.1 ROS1 gene_id:6098|Hs108|chr6 (2347) 1024 117.3 6.2e-25
CCDS73785.1 IGF1R gene_id:3480|Hs108|chr15 (1366) 939 108.6 1.5e-22
CCDS10378.1 IGF1R gene_id:3480|Hs108|chr15 (1367) 939 108.6 1.5e-22
CCDS1160.1 INSRR gene_id:3645|Hs108|chr1 (1297) 910 105.7 1e-21
CCDS42487.1 INSR gene_id:3643|Hs108|chr19 (1370) 899 104.7 2.3e-21
CCDS12176.1 INSR gene_id:3643|Hs108|chr19 (1382) 899 104.7 2.3e-21
CCDS35050.1 NTRK2 gene_id:4915|Hs108|chr9 ( 822) 793 93.9 2.3e-18
CCDS6671.1 NTRK2 gene_id:4915|Hs108|chr9 ( 838) 793 93.9 2.3e-18
CCDS30890.1 NTRK1 gene_id:4914|Hs108|chr1 ( 760) 792 93.8 2.4e-18
CCDS30891.1 NTRK1 gene_id:4914|Hs108|chr1 ( 790) 792 93.8 2.4e-18
CCDS1161.1 NTRK1 gene_id:4914|Hs108|chr1 ( 796) 792 93.8 2.4e-18
CCDS58399.1 NTRK3 gene_id:4916|Hs108|chr15 ( 817) 781 92.7 5.2e-18
CCDS10340.1 NTRK3 gene_id:4916|Hs108|chr15 ( 825) 781 92.7 5.2e-18
CCDS12574.1 AXL gene_id:558|Hs108|chr19 ( 885) 764 91.1 1.8e-17
CCDS62677.1 AXL gene_id:558|Hs108|chr19 ( 626) 758 90.3 2.1e-17
CCDS12575.1 AXL gene_id:558|Hs108|chr19 ( 894) 758 90.5 2.7e-17
CCDS626.1 ROR1 gene_id:4919|Hs108|chr1 ( 937) 726 87.4 2.4e-16
CCDS4887.1 PTK7 gene_id:5754|Hs108|chr6 (1014) 722 87.0 3.4e-16
CCDS4886.1 PTK7 gene_id:5754|Hs108|chr6 ( 940) 715 86.3 5.2e-16
CCDS4885.1 PTK7 gene_id:5754|Hs108|chr6 (1030) 715 86.4 5.5e-16
CCDS4884.1 PTK7 gene_id:5754|Hs108|chr6 (1070) 715 86.4 5.6e-16
CCDS59021.1 PTK7 gene_id:5754|Hs108|chr6 (1078) 715 86.4 5.6e-16
CCDS2094.1 MERTK gene_id:10461|Hs108|chr2 ( 999) 710 85.8 7.6e-16
CCDS81866.1 TYRO3 gene_id:7301|Hs108|chr15 ( 845) 692 84.0 2.3e-15
CCDS10080.1 TYRO3 gene_id:7301|Hs108|chr15 ( 890) 692 84.0 2.4e-15
CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 672 82.1 1e-14
CCDS3354.1 FGFR3 gene_id:2261|Hs108|chr4 ( 694) 668 81.5 1.1e-14
CCDS3353.1 FGFR3 gene_id:2261|Hs108|chr4 ( 806) 668 81.6 1.2e-14
CCDS54706.1 FGFR3 gene_id:2261|Hs108|chr4 ( 808) 668 81.6 1.2e-14
CCDS78389.1 TEK gene_id:7010|Hs108|chr9 ( 976) 662 81.1 2e-14
CCDS82777.1 MST1R gene_id:4486|Hs108|chr3 (1294) 664 81.5 2.1e-14
CCDS58833.1 MST1R gene_id:4486|Hs108|chr3 (1351) 664 81.5 2.1e-14
CCDS2807.1 MST1R gene_id:4486|Hs108|chr3 (1400) 664 81.5 2.2e-14
CCDS78096.1 FGFR4 gene_id:2264|Hs108|chr5 ( 734) 656 80.4 2.5e-14
CCDS4411.1 FGFR4 gene_id:2264|Hs108|chr5 ( 762) 656 80.4 2.6e-14
CCDS4410.1 FGFR4 gene_id:2264|Hs108|chr5 ( 802) 656 80.4 2.6e-14
CCDS43731.1 FGFR1 gene_id:2260|Hs108|chr8 ( 731) 655 80.3 2.7e-14
CCDS43730.1 FGFR1 gene_id:2260|Hs108|chr8 ( 733) 655 80.3 2.7e-14
CCDS55221.1 FGFR1 gene_id:2260|Hs108|chr8 ( 812) 655 80.3 2.9e-14
CCDS55222.1 FGFR1 gene_id:2260|Hs108|chr8 ( 820) 655 80.3 2.9e-14
CCDS43732.1 FGFR1 gene_id:2260|Hs108|chr8 ( 820) 655 80.3 2.9e-14
CCDS6107.2 FGFR1 gene_id:2260|Hs108|chr8 ( 822) 655 80.3 2.9e-14
CCDS55223.1 FGFR1 gene_id:2260|Hs108|chr8 ( 853) 655 80.3 2.9e-14
CCDS75825.1 TEK gene_id:7010|Hs108|chr9 (1081) 651 80.1 4.5e-14
CCDS6519.1 TEK gene_id:7010|Hs108|chr9 (1124) 651 80.1 4.6e-14
CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 642 79.1 7.8e-14
>>CCDS33172.1 ALK gene_id:238|Hs108|chr2 (1620 aa)
initn: 11178 init1: 11178 opt: 11178 Z-score: 5973.7 bits: 1118.2 E(32554): 0
Smith-Waterman score: 11178; 99.8% identity (100.0% similar) in 1620 aa overlap (1-1620:1-1620)
10 20 30 40 50 60
pF1KB4 MGAIGLLWLLPLLLSTAAVGSGMGTGQRAGSPAAGPPLQPREPLSYSRLQRKSLAVDFVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MGAIGLLWLLPLLLSTAAVGSGMGTGQRAGSPAAGPPLQPREPLSYSRLQRKSLAVDFVV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 PSLFRVYARDLLLPPSSSELKAGRPEARGSLALDCAPLLRLLGPAPGVSWTAGSPAPAEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PSLFRVYARDLLLPPSSSELKAGRPEARGSLALDCAPLLRLLGPAPGVSWTAGSPAPAEA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 RTLSRVLKGGSVRKLRRAKQLVLELGEEAILEGCVGPPGEAAVGLLQFNLSELFSWWIRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RTLSRVLKGGSVRKLRRAKQLVLELGEEAILEGCVGPPGEAAVGLLQFNLSELFSWWIRQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 GEGRLRIRLMPEKKASEVGREGRLSAAIRASQPRLLFQIFGTGHSSLESPTNMPSPSPDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GEGRLRIRLMPEKKASEVGREGRLSAAIRASQPRLLFQIFGTGHSSLESPTNMPSPSPDY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 FTWNLTWIMKDSFPFLSHRSRYGLECSFDFPCELEYSPPLHDLRNQSWSWRRIPSEEASQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FTWNLTWIMKDSFPFLSHRSRYGLECSFDFPCELEYSPPLHDLRNQSWSWRRIPSEEASQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 MDLLDGPGAERSKEMPRGSFLLLNTSADSKHTILSPWMRSSSEHCTLAVSVHRHLQPSGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MDLLDGPGAERSKEMPRGSFLLLNTSADSKHTILSPWMRSSSEHCTLAVSVHRHLQPSGR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 YIAQLLPHNEAAREILLMPTPGKHGWTVLQGRIGRPDNPFRVALEYISSGNRSLSAVDFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YIAQLLPHNEAAREILLMPTPGKHGWTVLQGRIGRPDNPFRVALEYISSGNRSLSAVDFF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 ALKNCSEGTSPGSKMALQSSFTCWNGTVLQLGQACDFHQDCAQGEDESQMCRKLPVGFYC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ALKNCSEGTSPGSKMALQSSFTCWNGTVLQLGQACDFHQDCAQGEDESQMCRKLPVGFYC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 NFEDGFCGWTQGTLSPHTPQWQVRTLKDARFQDHQDHALLLSTTDVPASESATVTSATFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NFEDGFCGWTQGTLSPHTPQWQVRTLKDARFQDHQDHALLLSTTDVPASESATVTSATFP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 APIKSSPCELRMSWLIRGVLRGNVSLVLVENKTGKEQGRMVWHVAAYEGLSLWQWMVLPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 APIKSSPCELRMSWLIRGVLRGNVSLVLVENKTGKEQGRMVWHVAAYEGLSLWQWMVLPL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 LDVSDRFWLQMVAWWGQGSRAIVAFDNISISLDCYLTISGEDKILQNTAPKSRNLFERNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LDVSDRFWLQMVAWWGQGSRAIVAFDNISISLDCYLTISGEDKILQNTAPKSRNLFERNP
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 NKELKPGENSPRQTPIFDPTVHWLFTTCGASGPHGPTQAQCNNAYQNSNLSVEVGSEGPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NKELKPGENSPRQTPIFDPTVHWLFTTCGASGPHGPTQAQCNNAYQNSNLSVEVGSEGPL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 KGIQIWKVPATDTYSISGYGAAGGKGGKNTMMRSHGVSVLGIFNLEKDDMLYILVGQQGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KGIQIWKVPATDTYSISGYGAAGGKGGKNTMMRSHGVSVLGIFNLEKDDMLYILVGQQGE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 DACPSTNQLIQKVCIGENNVIEEEIRVNRSVHEWAGGGGGGGGATYVFKMKDGVPVPLII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DACPSTNQLIQKVCIGENNVIEEEIRVNRSVHEWAGGGGGGGGATYVFKMKDGVPVPLII
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 AAGGGGRAYGAKTDTFHPERLENNSSVLGLNGNSGAAGGGGGWNDNTSLLWAGKSLQEGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 AAGGGGRAYGAKTDTFHPERLENNSSVLGLNGNSGAAGGGGGWNDNTSLLWAGKSLQEGA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 TGGHSCPQAMKKWGWETRGGFGGGGGGCSSGGGGGGYIGGNAASNNDPEMDGEDGVSFIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TGGHSCPQAMKKWGWETRGGFGGGGGGCSSGGGGGGYIGGNAASNNDPEMDGEDGVSFIS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 PLGILYTPALKVMEGHGEVNIKHYLNCSHCEVDECHMDPESHKVICFCDHGTVLAEDGVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PLGILYTPALKVMEGHGEVNIKHYLNCSHCEVDECHMDPESHKVICFCDHGTVLAEDGVS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB4 CIVSPTPEPHLPLSLILSVVTSALVAALVLAFSGIMIVYRRKHQELQAMQMELQSPEYKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CIVSPTPEPHLPLSLILSVVTSALVAALVLAFSGIMIVYRRKHQELQAMQMELQSPEYKL
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB4 SKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPN
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB4 DPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMA
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB4 GGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCP
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB4 GPGRVAKIGDFGMARDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GPGRVAKIGDFGMARDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLW
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB4 EIFSLGYMPYPSKSNQEVLEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EIFSLGYMPYPSKSNQEVLEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIIL
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB4 ERIEYCTQDPDVINTALPIEYGPLVEEEEKVPVRPKDPEGVPPLLVSQQAKREEERSPAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ERIEYCTQDPDVINTALPIEYGPLVEEEEKVPVRPKDPEGVPPLLVSQQAKREEERSPAA
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB4 PPPLPTTSSGKAAKKPTAAEVSVRVPRGPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPT
::::::::::::::::::::.:::::::::::::::::::::::::::::.:::::::::
CCDS33 PPPLPTTSSGKAAKKPTAAEISVRVPRGPAVEGGHVNMAFSQSNPPSELHKVHGSRNKPT
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB4 SLWNPTYGSWFTEKPTKKNNPIAKKEPHERGNLGLEGSCTVPPNVATGRLPGASLLLEPS
::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::::
CCDS33 SLWNPTYGSWFTEKPTKKNNPIAKKEPHDRGNLGLEGSCTVPPNVATGRLPGASLLLEPS
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB4 SLTANMKEVPLFRLRHFPCGNVNYGYQQQGLPLEAATAPGAGHYEDTILKSKNSMNQPGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SLTANMKEVPLFRLRHFPCGNVNYGYQQQGLPLEAATAPGAGHYEDTILKSKNSMNQPGP
1570 1580 1590 1600 1610 1620
>>CCDS10077.1 LTK gene_id:4058|Hs108|chr15 (864 aa)
initn: 2767 init1: 2275 opt: 2626 Z-score: 1419.7 bits: 274.7 E(32554): 9.4e-73
Smith-Waterman score: 3136; 55.5% identity (76.0% similar) in 859 aa overlap (608-1450:4-843)
580 590 600 610 620 630
pF1KB4 GRMVWHVAAYEGLSLWQWMVLPLLDVSDRFWLQMVAWWGQGSRAIVAFDNISISLDCYLT
: :...:.: .. . . . : . .:
CCDS10 MGCWGQLLVWFGAAGAILCSSPG---SQETFLR
10 20 30
640 650 660 670 680 690
pF1KB4 ISGEDKILQNTAPKSRNLFERNPNKELKPGENSPRQTPIFDPTVHWLFTTCGASGPHGPT
: : ..:. :. : . :.:. :: ..: . . :::.:::::: ::::
CCDS10 SSP----LPLASPSPRDPKVSAPPSILEPA--SPLNSPGTEGS--WLFSTCGASGRHGPT
40 50 60 70 80
700 710 720 730 740 750
pF1KB4 QAQCNNAYQNSNLSVEVGSEGPLKGIQIWKVPATDTYSISGYGAAGGKGGKNTMMRSHGV
:.::..:: .... : ::. : :.:.:.:.::. : ::.::::::::.:: . :.:::
CCDS10 QTQCDGAYAGTSVVVTVGAAGQLRGVQLWRVPGPGQYLISAYGAAGGKGAKNHLSRAHGV
90 100 110 120 130 140
760 770 780 790 800 810
pF1KB4 SVLGIFNLEKDDMLYILVGQQGEDACPSTNQLIQKVCIGENNVIEEEIRVNRS-----VH
: .::.: . ::::::::::::::. . : ::.::. ..::. .. : .
CCDS10 FVSAIFSLGLGESLYILVGQQGEDACPGGSPESQLVCLGESRAVEEHAAMDGSEGVPGSR
150 160 170 180 190 200
820 830 840 850 860
pF1KB4 EWAGGGGGGGGATYVFKMKDGVPVPLIIAAGGGGRAYGAKTDTFH----PERLENNSSVL
.:::::::::::::::... : ::..::::::::: : . ::.::: : .
CCDS10 RWAGGGGGGGGATYVFRVRAGELEPLLVAAGGGGRAYLRPRDRGRTQASPEKLENRSEAP
210 220 230 240 250 260
870 880 890 900 910 920
pF1KB4 GLNGNSGAAGGGGGWNDNTSLLWAGKSLQEGATGGHSCPQAMKKWGWETRGGFGGGGGGC
: .: .:::::::::.. . ::.:::::: ::..: .: :: . ::::::::.:
CCDS10 GSGGRGGAAGGGGGWTSRAPSPQAGRSLQEGAEGGQGCSEAWATLGWAAAGGFGGGGGAC
270 280 290 300 310 320
930 940 950 960 970 980
pF1KB4 SSGGGGGGYIGGNAASNNDPEMDGEDGVSFISPLGILYTPALKVMEGHGEVNIKHYLNCS
..::::::: ::.:. ... ::::::::: : . :. : : :.::::.:...::::
CCDS10 TAGGGGGGYRGGDASETDNLWADGEDGVSFIHPSSELFLQPLAVTENHGEVEIRRHLNCS
330 340 350 360 370 380
990 1000 1010 1020 1030 1040
pF1KB4 HCEVDECHMDPESHKVICFCDHGTVLAEDGVSCIVSPTPEPHLPLSLILSVVTSALVAAL
:: . .:. . : . . :.: .: :: :.:.:. .: :: :...::... .. :
CCDS10 HCPLRDCQWQAELQLAECLCPEGMELAVDNVTCM--DLHKPPGPLVLMVAVVATSTLSLL
390 400 410 420 430 440
1050 1060 1070 1080 1090 1100
pF1KB4 VLAFSGIMIVYRRKH-QELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSIS-
.. :..:. ..:. : :: .:.: ::: .:::::::.: : :: :: .: . :
CCDS10 MV--CGVLILVKQKKWQGLQ--EMRLPSPELELSKLRTSAIRTAPNPYYCQVGLGPAQSW
450 460 470 480 490
1110 1120 1130 1140 1150 1160
pF1KB4 ----DLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDEL
. :: :.::.:.:::::::::::: : :.:.: ::::::.:::::.:: ::::
CCDS10 PLPPGVTEVSPANVTLLRALGHGAFGEVYEGLVIGLPGDSSPLQVAIKTLPELCSPQDEL
500 510 520 530 540 550
1170 1180 1190 1200 1210 1220
pF1KB4 DFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLA
:::::::::::: :::::::.:.::.. ::.::::::.:::.:::::..::. .::: :.
CCDS10 DFLMEALIISKFRHQNIVRCVGLSLRATPRLILLELMSGGDMKSFLRHSRPHLGQPSPLV
560 570 580 590 600 610
1230 1240 1250 1260 1270 1280
pF1KB4 MLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASY
: :::..:.::: ::.:::::::::::::::::::.: ::.:::::::::::::::::::
CCDS10 MRDLLQLAQDIAQGCHYLEENHFIHRDIAARNCLLSCAGPSRVAKIGDFGMARDIYRASY
620 630 640 650 660 670
1290 1300 1310 1320 1330 1340
pF1KB4 YRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFV
::.: :.:::::::::::.:::::::::.:::::::::::::::::::...:::::.::
CCDS10 YRRGDRALLPVKWMPPEAFLEGIFTSKTDSWSFGVLLWEIFSLGYMPYPGRTNQEVLDFV
680 690 700 710 720 730
1350 1360 1370 1380 1390 1400
pF1KB4 TSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYG
..:::::::..:::::::::::::::.:: ::.:: ::::..::::::::.:. ::.: :
CCDS10 VGGGRMDPPRGCPGPVYRIMTQCWQHEPELRPSFASILERLQYCTQDPDVLNSLLPMELG
740 750 760 770 780 790
1410 1420 1430 1440 1450 1460
pF1KB4 PLVEEEEKVPVRPKDPEGV-PPLLVSQQAKREEERSPAAPPPLPTTSSGKAAKKPTAAEV
: ::: . .. : . :: :. . :. .: .. : : :::
CCDS10 PTPEEEGTSGLGNRSLECLRPPQ--PQELSPEKLKSWGGSPLGPWLSSGLKPLKSRGLQP
800 810 820 830 840 850
1470 1480 1490 1500 1510 1520
pF1KB4 SVRVPRGPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPTSLWNPTYGSWFTEKPTKKNNP
CCDS10 QNLWNPTYRS
860
>>CCDS10078.1 LTK gene_id:4058|Hs108|chr15 (803 aa)
initn: 2448 init1: 1956 opt: 2142 Z-score: 1162.1 bits: 226.9 E(32554): 2.1e-58
Smith-Waterman score: 2748; 51.8% identity (70.8% similar) in 859 aa overlap (608-1450:4-782)
580 590 600 610 620 630
pF1KB4 GRMVWHVAAYEGLSLWQWMVLPLLDVSDRFWLQMVAWWGQGSRAIVAFDNISISLDCYLT
: :...:.: .. . . . : . .:
CCDS10 MGCWGQLLVWFGAAGAILCSSPG---SQETFLR
10 20 30
640 650 660 670 680 690
pF1KB4 ISGEDKILQNTAPKSRNLFERNPNKELKPGENSPRQTPIFDPTVHWLFTTCGASGPHGPT
: : ..:. :. : . :.:. :: ..: . . :::.:::::: ::::
CCDS10 SSP----LPLASPSPRDPKVSAPPSILEPA--SPLNSPGTEGS--WLFSTCGASGRHGPT
40 50 60 70 80
700 710 720 730 740 750
pF1KB4 QAQCNNAYQNSNLSVEVGSEGPLKGIQIWKVPATDTYSISGYGAAGGKGGKNTMMRSHGV
:.::..:: .... : ::. : :.:.:.:.::. : ::.::::::::.:: . :.:::
CCDS10 QTQCDGAYAGTSVVVTVGAAGQLRGVQLWRVPGPGQYLISAYGAAGGKGAKNHLSRAHGV
90 100 110 120 130 140
760 770 780 790 800 810
pF1KB4 SVLGIFNLEKDDMLYILVGQQGEDACPSTNQLIQKVCIGENNVIEEEIRVNRS-----VH
: .::.: . ::::::::::::::. . : ::.::. ..::. .. : .
CCDS10 FVSAIFSLGLGESLYILVGQQGEDACPGGSPESQLVCLGESRAVEEHAAMDGSEGVPGSR
150 160 170 180 190 200
820 830 840 850 860
pF1KB4 EWAGGGGGGGGATYVFKMKDGVPVPLIIAAGGGGRAYGAKTDTFH----PERLENNSSVL
.:::::::::::::::... : ::..::::::::: : . ::.::: : .
CCDS10 RWAGGGGGGGGATYVFRVRAGELEPLLVAAGGGGRAYLRPRDRGRTQASPEKLENRSEAP
210 220 230 240 250 260
870 880 890 900 910 920
pF1KB4 GLNGNSGAAGGGGGWNDNTSLLWAGKSLQEGATGGHSCPQAMKKWGWETRGGFGGGGGGC
: .: .::::: .. .:: :::
CCDS10 GSGGRGGAAGGDASETDN---LWA------------------------------------
270 280
930 940 950 960 970 980
pF1KB4 SSGGGGGGYIGGNAASNNDPEMDGEDGVSFISPLGILYTPALKVMEGHGEVNIKHYLNCS
::::::::: : . :. : : :.::::.:...::::
CCDS10 ----------------------DGEDGVSFIHPSSELFLQPLAVTENHGEVEIRRHLNCS
290 300 310 320
990 1000 1010 1020 1030 1040
pF1KB4 HCEVDECHMDPESHKVICFCDHGTVLAEDGVSCIVSPTPEPHLPLSLILSVVTSALVAAL
:: . .:. . : . . :.: .: :: :.:.:. .: :: :...::... .. :
CCDS10 HCPLRDCQWQAELQLAECLCPEGMELAVDNVTCM--DLHKPPGPLVLMVAVVATSTLSLL
330 340 350 360 370
1050 1060 1070 1080 1090 1100
pF1KB4 VLAFSGIMIVYRRKH-QELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSIS-
.. :..:. ..:. : :: .:.: ::: .:::::::.: : :: :: .: . :
CCDS10 MV--CGVLILVKQKKWQGLQ--EMRLPSPELELSKLRTSAIRTAPNPYYCQVGLGPAQSW
380 390 400 410 420 430
1110 1120 1130 1140 1150 1160
pF1KB4 ----DLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDEL
. :: :.::.:.:::::::::::: : :.:.: ::::::.:::::.:: ::::
CCDS10 PLPPGVTEVSPANVTLLRALGHGAFGEVYEGLVIGLPGDSSPLQVAIKTLPELCSPQDEL
440 450 460 470 480 490
1170 1180 1190 1200 1210 1220
pF1KB4 DFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLA
:::::::::::: :::::::.:.::.. ::.::::::.:::.:::::..::. .::: :.
CCDS10 DFLMEALIISKFRHQNIVRCVGLSLRATPRLILLELMSGGDMKSFLRHSRPHLGQPSPLV
500 510 520 530 540 550
1230 1240 1250 1260 1270 1280
pF1KB4 MLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASY
: :::..:.::: ::.:::::::::::::::::::.: ::.:::::::::::::::::::
CCDS10 MRDLLQLAQDIAQGCHYLEENHFIHRDIAARNCLLSCAGPSRVAKIGDFGMARDIYRASY
560 570 580 590 600 610
1290 1300 1310 1320 1330 1340
pF1KB4 YRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFV
::.: :.:::::::::::.:::::::::.:::::::::::::::::::...:::::.::
CCDS10 YRRGDRALLPVKWMPPEAFLEGIFTSKTDSWSFGVLLWEIFSLGYMPYPGRTNQEVLDFV
620 630 640 650 660 670
1350 1360 1370 1380 1390 1400
pF1KB4 TSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYG
..:::::::..:::::::::::::::.:: ::.:: ::::..::::::::.:. ::.: :
CCDS10 VGGGRMDPPRGCPGPVYRIMTQCWQHEPELRPSFASILERLQYCTQDPDVLNSLLPMELG
680 690 700 710 720 730
1410 1420 1430 1440 1450 1460
pF1KB4 PLVEEEEKVPVRPKDPEGV-PPLLVSQQAKREEERSPAAPPPLPTTSSGKAAKKPTAAEV
: ::: . .. : . :: :. . :. .: .. : : :::
CCDS10 PTPEEEGTSGLGNRSLECLRPPQ--PQELSPEKLKSWGGSPLGPWLSSGLKPLKSRGLQP
740 750 760 770 780 790
1470 1480 1490 1500 1510 1520
pF1KB4 SVRVPRGPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPTSLWNPTYGSWFTEKPTKKNNP
CCDS10 QNLWNPTYRS
800
>>CCDS45237.1 LTK gene_id:4058|Hs108|chr15 (734 aa)
initn: 2267 init1: 1490 opt: 1510 Z-score: 825.8 bits: 164.6 E(32554): 1.1e-39
Smith-Waterman score: 2330; 46.9% identity (64.7% similar) in 853 aa overlap (608-1450:4-713)
580 590 600 610 620 630
pF1KB4 GRMVWHVAAYEGLSLWQWMVLPLLDVSDRFWLQMVAWWGQGSRAIVAFDNISISLDCYLT
: :...:.: .. . . . : . .:
CCDS45 MGCWGQLLVWFGAAGAILCSSPG---SQETFLR
10 20 30
640 650 660 670 680 690
pF1KB4 ISGEDKILQNTAPKSRNLFERNPNKELKPGENSPRQTPIFDPTVHWLFTTCGASGPHGPT
: : ..:. :. : . :.:. :: ..: . . :::.:::::: ::::
CCDS45 SSP----LPLASPSPRDPKVSAPPSILEPA--SPLNSPGTEGS--WLFSTCGASGRHGPT
40 50 60 70 80
700 710 720 730 740 750
pF1KB4 QAQCNNAYQNSNLSVEVGSEGPLKGIQIWKVPATDTYSISGYGAAGGKGGKNTMMRSHGV
:.::..:: .... : ::. : :.:.:.:.::. : ::.::::::::.:: . :.:::
CCDS45 QTQCDGAYAGTSVVVTVGAAGQLRGVQLWRVPGPGQYLISAYGAAGGKGAKNHLSRAHGV
90 100 110 120 130 140
760 770 780 790 800 810
pF1KB4 SVLGIFNLEKDDMLYILVGQQGEDACPSTNQLIQKVCIGENNVIEEEIRVNRS-----VH
: .::.: . ::::::::::::::. . : ::.::. ..::. .. : .
CCDS45 FVSAIFSLGLGESLYILVGQQGEDACPGGSPESQLVCLGESRAVEEHAAMDGSEGVPGSR
150 160 170 180 190 200
820 830 840 850 860
pF1KB4 EWAGGGGGGGGATYVFKMKDGVPVPLIIAAGGGGRAYGAKTDTFH----PERLENNSSVL
.:::::::::::::::... : ::..::::::::: : . ::.::: : .
CCDS45 RWAGGGGGGGGATYVFRVRAGELEPLLVAAGGGGRAYLRPRDRGRTQASPEKLENRSEAP
210 220 230 240 250 260
870 880 890 900 910 920
pF1KB4 GLNGNSGAAGGGGGWNDNTSLLWAGKSLQEGATGGHSCPQAMKKWGWETRGGFGGGGGGC
: .: .::::: .. .:: :::
CCDS45 GSGGRGGAAGGDASETDN---LWA------------------------------------
270 280
930 940 950 960 970 980
pF1KB4 SSGGGGGGYIGGNAASNNDPEMDGEDGVSFISPLGILYTPALKVMEGHGEVNIKHYLNCS
::::::::: : . :. : : :.::::.:...::::
CCDS45 ----------------------DGEDGVSFIHPSSELFLQPLAVTENHGEVEIRRHLNCS
290 300 310 320
990 1000 1010 1020 1030 1040
pF1KB4 HCEVDECHMDPESHKVICFCDHGTVLAEDGVSCIVSPTPEPHLPLSLILSVVTSALVAAL
:: . .:. . : . . :.: .: :: :.:.:. .: :: :...::... .. :
CCDS45 HCPLRDCQWQAELQLAECLCPEGMELAVDNVTCM--DLHKPPGPLVLMVAVVATSTLSLL
330 340 350 360 370
1050 1060 1070 1080 1090 1100
pF1KB4 VLAFSGIMIVYRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDL
.. :..: . :. .:. :
CCDS45 MVC--GVLI-------------------------------LGGAWPGPVLASATRC----
380 390 400
1110 1120 1130 1140 1150 1160
pF1KB4 KEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEA
: .: :: : .::::.:: ::::::::::
CCDS45 ---------------HRGF--------------PSQCYSA-QTLPELCSPQDELDFLMEA
410 420 430
1170 1180 1190 1200 1210 1220
pF1KB4 LIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLH
:::::: :::::::.:.::.. ::.::::::.:::.:::::..::. .::: :.: :::.
CCDS45 LIISKFRHQNIVRCVGLSLRATPRLILLELMSGGDMKSFLRHSRPHLGQPSPLVMRDLLQ
440 450 460 470 480 490
1230 1240 1250 1260 1270 1280
pF1KB4 VARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGC
.:.::: ::.:::::::::::::::::::.: ::.:::::::::::::::::::::.:
CCDS45 LAQDIAQGCHYLEENHFIHRDIAARNCLLSCAGPSRVAKIGDFGMARDIYRASYYRRGDR
500 510 520 530 540 550
1290 1300 1310 1320 1330 1340
pF1KB4 AMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGRM
:.:::::::::::.:::::::::.:::::::::::::::::::...:::::.::..::::
CCDS45 ALLPVKWMPPEAFLEGIFTSKTDSWSFGVLLWEIFSLGYMPYPGRTNQEVLDFVVGGGRM
560 570 580 590 600 610
1350 1360 1370 1380 1390 1400
pF1KB4 DPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEE
:::..:::::::::::::::.:: ::.:: ::::..::::::::.:. ::.: :: :::
CCDS45 DPPRGCPGPVYRIMTQCWQHEPELRPSFASILERLQYCTQDPDVLNSLLPMELGPTPEEE
620 630 640 650 660 670
1410 1420 1430 1440 1450 1460
pF1KB4 EKVPVRPKDPEGV-PPLLVSQQAKREEERSPAAPPPLPTTSSGKAAKKPTAAEVSVRVPR
. .. : . :: :. . :. .: .. : : :::
CCDS45 GTSGLGNRSLECLRPPQ--PQELSPEKLKSWGGSPLGPWLSSGLKPLKSRGLQPQNLWNP
680 690 700 710 720 730
1470 1480 1490 1500 1510 1520
pF1KB4 GPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPTSLWNPTYGSWFTEKPTKKNNPIAKKEP
CCDS45 TYRS
>>CCDS5116.1 ROS1 gene_id:6098|Hs108|chr6 (2347 aa)
initn: 1031 init1: 547 opt: 1024 Z-score: 561.2 bits: 117.3 E(32554): 6.2e-25
Smith-Waterman score: 1051; 39.1% identity (67.4% similar) in 463 aa overlap (1027-1458:1858-2311)
1000 1010 1020 1030 1040 1050
pF1KB4 MDPESHKVICFCDHGTVLAEDGVSCIVSPTPEPHLPLSLILSVVTSALVAALVLAFSGIM
:: . :..:... ::... :.:
CCDS51 FRVVAANNLGFGEYSGISENIILVGDDFWIPETSFILTIIVGIF---LVVTIPLTF----
1830 1840 1850 1860 1870 1880
1060 1070 1080 1090 1100 1110
pF1KB4 IVYRRKHQELQAMQ--MELQSPEYKLSKLRTSTIMTDYNPNYCFAGKT----SSISDLKE
. .:: ... .: . : . . .:..:: . . : :.: .: : .:
CCDS51 VWHRRLKNQKSAKEGVTVLINEDKELAELRGLAAGVGLA-NACYAIHTLPTQEEIENLPA
1890 1900 1910 1920 1930
1120 1130 1140 1150 1160
pF1KB4 VPRKNITLIRGLGHGAFGEVYEGQ-VSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEAL
::...:: :: ::::::::: :. . . ..:::::: . ..:....:: ::
CCDS51 FPREKLTLRLLLGSGAFGEVYEGTAVDILGVGSGEIKVAVKTLKKGSTDQEKIEFLKEAH
1940 1950 1960 1970 1980 1990
1170 1180 1190 1200 1210 1220
pF1KB4 IISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLHV
..::::: ::.. .:: : . :..:.:::: :::: ..::..: :...::. .
CCDS51 LMSKFNHPNILKQLGVCLLNEPQYIILELMEGGDLLTYLRKARMATFYGPLLTLVDLVDL
2000 2010 2020 2030 2040 2050
1230 1240 1250 1260 1270 1280
pF1KB4 ARDIACGCQYLEENHFIHRDIAARNCLLTCP---GPGRVAKIGDFGMARDIYRASYYRKG
::. :: :::. ::::::.::::::.. .: :..::::::.:::::. .::::
CCDS51 CVDISKGCVYLERMHFIHRDLAARNCLVSVKDYTSP-RIVKIGDFGLARDIYKNDYYRKR
2060 2070 2080 2090 2100 2110
1290 1300 1310 1320 1330 1340
pF1KB4 GCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGG
: ..:::.:: ::..:.::::...:.::::.:.:::..::..:::..:: .::..: .::
CCDS51 GEGLLPVRWMAPESLMDGIFTTQSDVWSFGILIWEILTLGHQPYPAHSNLDVLNYVQTGG
2120 2130 2140 2150 2160 2170
1350 1360 1370 1380 1390
pF1KB4 RMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIE----------YCTQDP----DV
:..::.::: .. .::::: ..:..::.: : .... : ..: :
CCDS51 RLEPPRNCPDDLWNLMTQCWAQEPDQRPTFHRIQDQLQLFRNFFLNSIYKSRDEANNSGV
2180 2190 2200 2210 2220 2230
1400 1410 1420 1430 1440
pF1KB4 INTALPIEYGPLV--EEEEKVPV---RPKDPEGVPPLLVSQQAKREEERSPAAPPPLPTT
:: .. : : .. . .. .:: . :. ::. .... . . ::.: . .
CCDS51 INESFEGEDGDVICLNSDDIMPVALMETKNREGLNYMVLATECGQGEEKSEGPLGSQESE
2240 2250 2260 2270 2280 2290
1450 1460 1470 1480 1490 1500
pF1KB4 SSG--KAAKKPTAAEVSVRVPRGPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPTSLWNP
: : : :.: :
CCDS51 SCGLRKEEKEPHADKDFCQEKQVAYCPSGKPEGLNYACLTHSGYGDGSD
2300 2310 2320 2330 2340
>>CCDS73785.1 IGF1R gene_id:3480|Hs108|chr15 (1366 aa)
initn: 735 init1: 735 opt: 939 Z-score: 518.5 bits: 108.6 E(32554): 1.5e-22
Smith-Waterman score: 948; 38.2% identity (68.3% similar) in 401 aa overlap (1081-1477:964-1349)
1060 1070 1080 1090 1100 1110
pF1KB4 AFSGIMIVYRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKE
:.: ....... ::.: :.. . : :
CCDS73 HLIIALPVAVLLIVGGLVIMLYVFHRKRNNSRLGNGVLYASVNPEY-FSAADVYVPDEWE
940 950 960 970 980 990
1120 1130 1140 1150 1160 1170
pF1KB4 VPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALI
: :..::. : ::.:.:: :::: ..:. .: .::.::. :. : .....:: :: .
CCDS73 VAREKITMSRELGQGSFGMVYEGVAKGVVKDEPETRVAIKTVNEAASMRERIEFLNEASV
1000 1010 1020 1030 1040 1050
1180 1190 1200 1210 1220
pF1KB4 ISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLA---MLDLL
...:: ...:: .:: :. : ....:::. :::::.:: ::. . :: . ..
CCDS73 MKEFNCHHVVRLLGVVSQGQPTLVIMELMTRGDLKSYLRSLRPEMENNPVLAPPSLSKMI
1060 1070 1080 1090 1100 1110
1230 1240 1250 1260 1270 1280
pF1KB4 HVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGG
..: .:: : ::. :.:.:::.:::::... ..:::::::.::::...::::::
CCDS73 QMAGEIADGMAYLNANKFVHRDLAARNCMVA---EDFTVKIGDFGMTRDIYETDYYRKGG
1120 1130 1140 1150 1160
1290 1300 1310 1320 1330 1340
pF1KB4 CAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGR
..:::.:: ::.. .:.::. .:.:::::.:::: .:. .:: . ::..::.:: ::
CCDS73 KGLLPVRWMSPESLKDGVFTTYSDVWSFGVVLWEIATLAEQPYQGLSNEQVLRFVMEGGL
1170 1180 1190 1200 1210 1220
1350 1360 1370 1380 1390 1400
pF1KB4 MDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEE
.: : ::: ....: .:::..:. ::.: :. :. ..: .... . :
CCDS73 LDKPDNCPDMLFELMRMCWQYNPKMRPSFLEIISSIKE-EMEPGFREVSFYYSEENKLPE
1230 1240 1250 1260 1270 1280
1410 1420 1430 1440 1450 1460
pF1KB4 EEKVPVRPKDPEGVPPLLVSQQAKREEERSPAAPPPLPTTSSG-KAAKKPTAAEVSVRVP
:.. ..:.. :.:: . . .. ::: :: :: . : . . .:.
CCDS73 PEELDLEPENMESVP----------LDPSASSSSLPLPDRHSGHKAENGPGPGVLVLRAS
1290 1300 1310 1320 1330
1470 1480 1490 1500 1510 1520
pF1KB4 RGPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPTSLWNPTYGSWFTEKPTKKNNPIAKKE
.:.:
CCDS73 FDERQPYAHMNGGRKNERALPLPQSSTC
1340 1350 1360
>>CCDS10378.1 IGF1R gene_id:3480|Hs108|chr15 (1367 aa)
initn: 735 init1: 735 opt: 939 Z-score: 518.5 bits: 108.6 E(32554): 1.5e-22
Smith-Waterman score: 948; 38.2% identity (68.3% similar) in 401 aa overlap (1081-1477:965-1350)
1060 1070 1080 1090 1100 1110
pF1KB4 AFSGIMIVYRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKE
:.: ....... ::.: :.. . : :
CCDS10 HLIIALPVAVLLIVGGLVIMLYVFHRKRNNSRLGNGVLYASVNPEY-FSAADVYVPDEWE
940 950 960 970 980 990
1120 1130 1140 1150 1160 1170
pF1KB4 VPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALI
: :..::. : ::.:.:: :::: ..:. .: .::.::. :. : .....:: :: .
CCDS10 VAREKITMSRELGQGSFGMVYEGVAKGVVKDEPETRVAIKTVNEAASMRERIEFLNEASV
1000 1010 1020 1030 1040 1050
1180 1190 1200 1210 1220
pF1KB4 ISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLA---MLDLL
...:: ...:: .:: :. : ....:::. :::::.:: ::. . :: . ..
CCDS10 MKEFNCHHVVRLLGVVSQGQPTLVIMELMTRGDLKSYLRSLRPEMENNPVLAPPSLSKMI
1060 1070 1080 1090 1100 1110
1230 1240 1250 1260 1270 1280
pF1KB4 HVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGG
..: .:: : ::. :.:.:::.:::::... ..:::::::.::::...::::::
CCDS10 QMAGEIADGMAYLNANKFVHRDLAARNCMVA---EDFTVKIGDFGMTRDIYETDYYRKGG
1120 1130 1140 1150 1160 1170
1290 1300 1310 1320 1330 1340
pF1KB4 CAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGR
..:::.:: ::.. .:.::. .:.:::::.:::: .:. .:: . ::..::.:: ::
CCDS10 KGLLPVRWMSPESLKDGVFTTYSDVWSFGVVLWEIATLAEQPYQGLSNEQVLRFVMEGGL
1180 1190 1200 1210 1220 1230
1350 1360 1370 1380 1390 1400
pF1KB4 MDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEE
.: : ::: ....: .:::..:. ::.: :. :. ..: .... . :
CCDS10 LDKPDNCPDMLFELMRMCWQYNPKMRPSFLEIISSIKE-EMEPGFREVSFYYSEENKLPE
1240 1250 1260 1270 1280
1410 1420 1430 1440 1450 1460
pF1KB4 EEKVPVRPKDPEGVPPLLVSQQAKREEERSPAAPPPLPTTSSG-KAAKKPTAAEVSVRVP
:.. ..:.. :.:: . . .. ::: :: :: . : . . .:.
CCDS10 PEELDLEPENMESVP----------LDPSASSSSLPLPDRHSGHKAENGPGPGVLVLRAS
1290 1300 1310 1320 1330
1470 1480 1490 1500 1510 1520
pF1KB4 RGPAVEGGHVNMAFSQSNPPSELHRVHGSRNKPTSLWNPTYGSWFTEKPTKKNNPIAKKE
.:.:
CCDS10 FDERQPYAHMNGGRKNERALPLPQSSTC
1340 1350 1360
>>CCDS1160.1 INSRR gene_id:3645|Hs108|chr1 (1297 aa)
initn: 911 init1: 702 opt: 910 Z-score: 503.3 bits: 105.7 E(32554): 1e-21
Smith-Waterman score: 910; 40.7% identity (71.2% similar) in 354 aa overlap (1082-1429:946-1291)
1060 1070 1080 1090 1100 1110
pF1KB4 FSGIMIVYRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEV
: :. :.... ::.: :... . : ::
CCDS11 DAGGLHVLLTATPVGLTLLIVLAALGFFYGKKRNRTLYASVNPEY-FSASDMYVPDEWEV
920 930 940 950 960 970
1120 1130 1140 1150 1160 1170
pF1KB4 PRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALII
::..:..:: ::.:.:: :::: . :. ::.::. :. : .. ..:: :: ..
CCDS11 PREQISIIRELGQGSFGMVYEGLARGLEAGEESTPVALKTVNELASPRECIEFLKEASVM
980 990 1000 1010 1020 1030
1180 1190 1200 1210 1220
pF1KB4 SKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPR----PSQPSSLAMLDLL
. :. ...:: .:: :. : ....:::. ::::: :: ::. :. :. :. ...
CCDS11 KAFKCHHVVRLLGVVSQGQPTLVIMELMTRGDLKSHLRSLRPEAENNPGLPQP-ALGEMI
1040 1050 1060 1070 1080 1090
1230 1240 1250 1260 1270 1280
pF1KB4 HVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGG
..: .:: : :: :.:.:::.:::::... ..:::::::.::.:...::::::
CCDS11 QMAGEIADGMAYLAANKFVHRDLAARNCMVS---QDFTVKIGDFGMTRDVYETDYYRKGG
1100 1110 1120 1130 1140 1150
1290 1300 1310 1320 1330 1340
pF1KB4 CAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGR
..:::.:: ::.. .::::...:.:::::.:::: .:. .:: . ::..::.:: .::
CCDS11 KGLLPVRWMAPESLKDGIFTTHSDVWSFGVVLWEIVTLAEQPYQGLSNEQVLKFVMDGGV
1160 1170 1180 1190 1200 1210
1350 1360 1370 1380 1390 1400
pF1KB4 MDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEE
.. ..:: . ..:..::: .:. ::.:. ::. :. . :. : . :.: .
CCDS11 LEELEGCPLQLQELMSRCWQPNPRLRPSFTHILDSIQEELR-PSF--RLLSFYYSPECRG
1220 1230 1240 1250 1260
1410 1420 1430 1440 1450 1460
pF1KB4 EE-KVPVRPKDPEGVP-PLLVSQQAKREEERSPAAPPPLPTTSSGKAAKKPTAAEVSVRV
. ..:. .:.. : : : :
CCDS11 ARGSLPTTDAEPDSSPTPRDCSPQNGGPGH
1270 1280 1290
>>CCDS42487.1 INSR gene_id:3643|Hs108|chr19 (1370 aa)
initn: 738 init1: 705 opt: 899 Z-score: 497.2 bits: 104.7 E(32554): 2.3e-21
Smith-Waterman score: 901; 39.0% identity (67.2% similar) in 418 aa overlap (1034-1434:940-1327)
1010 1020 1030 1040 1050 1060
pF1KB4 VICFCDHGTVLAEDGVSCIVSPTPEPHLPLSLILSVVTSALVAALVLAFS---GIMIVYR
: : ... . :. .:. :: : . ..
CCDS42 SVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLI--FVFLFSVVIGSIYLFL
910 920 930 940 950 960
1070 1080 1090 1100 1110
pF1KB4 RKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGK----TSSISDLKEVPRKNI
::.: :. :. : .:. ::.: :. . . : :: :..:
CCDS42 RKRQ-----------PDGPLGPLYASS-----NPEYLSASDVFPCSVYVPDEWEVSREKI
970 980 990 1000 1010
1120 1130 1140 1150 1160 1170
pF1KB4 TLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNH
::.: ::.:.:: ::::.. . . . .:::::. : : .....:: :: ... :.
CCDS42 TLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTC
1020 1030 1040 1050 1060 1070
1180 1190 1200 1210 1220 1230
pF1KB4 QNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPR----PSQPSSLAMLDLLHVARD
...:: .:: .. : ....:::: :::::.:: ::. :..: .. .....: .
CCDS42 HHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPP-TLQEMIQMAAE
1080 1090 1100 1110 1120 1130
1240 1250 1260 1270 1280 1290
pF1KB4 IACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGCAMLP
:: : ::. ..:.:::.:::::... ..:::::::.::::...:::::: ..::
CCDS42 IADGMAYLNAKKFVHRDLAARNCMVA---HDFTVKIGDFGMTRDIYETDYYRKGGKGLLP
1140 1150 1160 1170 1180
1300 1310 1320 1330 1340 1350
pF1KB4 VKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGRMDPPK
:.:: ::.. .:.::...: :::::.:::: ::. .:: . ::..::.:: .:: .: :
CCDS42 VRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPD
1190 1200 1210 1220 1230 1240
1360 1370 1380 1390 1400 1410
pF1KB4 NCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEEEKVP
::: : .: .::: .:. ::.: :: .. .: .. ..: : . . ::.:.:
CCDS42 NCPERVTDLMRMCWQFNPKMRPTF---LEIVNLLKDD---LHPSFP-EVSFFHSEENKAP
1250 1260 1270 1280 1290 1300
1420 1430 1440 1450 1460
pF1KB4 ------VRPKDPEGVPPLLVSQQAKREEERSPAAPPPLPTTSSGKAAKKPTAAEVSVRVP
.. .: :.:: : :.. .:::
CCDS42 ESEELEMEFEDMENVP-LDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNG
1310 1320 1330 1340 1350
>>CCDS12176.1 INSR gene_id:3643|Hs108|chr19 (1382 aa)
initn: 738 init1: 705 opt: 899 Z-score: 497.1 bits: 104.7 E(32554): 2.3e-21
Smith-Waterman score: 901; 39.0% identity (67.2% similar) in 418 aa overlap (1034-1434:952-1339)
1010 1020 1030 1040 1050 1060
pF1KB4 VICFCDHGTVLAEDGVSCIVSPTPEPHLPLSLILSVVTSALVAALVLAFS---GIMIVYR
: : ... . :. .:. :: : . ..
CCDS12 SVRIRATSLAGNGSWTEPTYFYVTDYLDVPSNIAKIIIGPLI--FVFLFSVVIGSIYLFL
930 940 950 960 970
1070 1080 1090 1100 1110
pF1KB4 RKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGK----TSSISDLKEVPRKNI
::.: :. :. : .:. ::.: :. . . : :: :..:
CCDS12 RKRQ-----------PDGPLGPLYASS-----NPEYLSASDVFPCSVYVPDEWEVSREKI
980 990 1000 1010 1020
1120 1130 1140 1150 1160 1170
pF1KB4 TLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNH
::.: ::.:.:: ::::.. . . . .:::::. : : .....:: :: ... :.
CCDS12 TLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNESASLRERIEFLNEASVMKGFTC
1030 1040 1050 1060 1070 1080
1180 1190 1200 1210 1220 1230
pF1KB4 QNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPR----PSQPSSLAMLDLLHVARD
...:: .:: .. : ....:::: :::::.:: ::. :..: .. .....: .
CCDS12 HHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPEAENNPGRPPP-TLQEMIQMAAE
1090 1100 1110 1120 1130 1140
1240 1250 1260 1270 1280 1290
pF1KB4 IACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGCAMLP
:: : ::. ..:.:::.:::::... ..:::::::.::::...:::::: ..::
CCDS12 IADGMAYLNAKKFVHRDLAARNCMVA---HDFTVKIGDFGMTRDIYETDYYRKGGKGLLP
1150 1160 1170 1180 1190
1300 1310 1320 1330 1340 1350
pF1KB4 VKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGRMDPPK
:.:: ::.. .:.::...: :::::.:::: ::. .:: . ::..::.:: .:: .: :
CCDS12 VRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLSNEQVLKFVMDGGYLDQPD
1200 1210 1220 1230 1240 1250
1360 1370 1380 1390 1400 1410
pF1KB4 NCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEEEKVP
::: : .: .::: .:. ::.: :: .. .: .. ..: : . . ::.:.:
CCDS12 NCPERVTDLMRMCWQFNPKMRPTF---LEIVNLLKDD---LHPSFP-EVSFFHSEENKAP
1260 1270 1280 1290 1300 1310
1420 1430 1440 1450 1460
pF1KB4 ------VRPKDPEGVPPLLVSQQAKREEERSPAAPPPLPTTSSGKAAKKPTAAEVSVRVP
.. .: :.:: : :.. .:::
CCDS12 ESEELEMEFEDMENVP-LDRSSHCQREEAGGRDGGSSLGFKRSYEEHIPYTHMNGGKKNG
1320 1330 1340 1350 1360 1370
1620 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 22:55:53 2016 done: Wed Nov 2 22:55:54 2016
Total Scan time: 5.830 Total Display time: 0.480
Function used was FASTA [36.3.4 Apr, 2011]