FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4465, 2321 aa
1>>>pF1KB4465 2321 - 2321 aa - 2321 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.5057+/-0.00138; mu= 6.7318+/- 0.084
mean_var=579.7663+/-114.272, 0's: 0 Z-trim(114.8): 249 B-trim: 0 in 0/53
Lambda= 0.053266
statistics sampled from 15126 (15376) to 15126 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.472), width: 16
Scan time: 8.180
The best scores are: opt bits E(32554)
CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321) 17489 1361.5 0
CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555) 5428 434.7 2.7e-120
CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471) 5232 419.6 9.1e-116
CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003) 2443 205.1 2.7e-51
CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144) 1610 141.4 6.4e-32
CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165) 1610 141.4 6.4e-32
CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871) 1497 132.7 2.5e-29
CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413) 1300 117.1 6.1e-25
CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 ( 870) 1275 114.9 1.7e-24
CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912) 1255 114.1 1e-23
CCDS9998.1 JAG2 gene_id:3714|Hs108|chr14 (1238) 1241 112.5 1.3e-23
CCDS13112.1 JAG1 gene_id:182|Hs108|chr20 (1218) 1198 109.2 1.3e-22
CCDS1390.1 CRB1 gene_id:23418|Hs108|chr1 (1406) 1190 108.6 2.1e-22
CCDS9999.1 JAG2 gene_id:3714|Hs108|chr14 (1200) 1156 105.9 1.2e-21
CCDS58053.1 CRB1 gene_id:23418|Hs108|chr1 (1382) 1101 101.8 2.4e-20
CCDS33390.1 DNER gene_id:92737|Hs108|chr2 ( 737) 1008 94.2 2.4e-18
CCDS6852.2 CRB2 gene_id:286204|Hs108|chr9 (1285) 962 91.1 3.8e-17
CCDS48004.1 SVEP1 gene_id:79987|Hs108|chr9 (3571) 959 91.5 7.9e-17
CCDS41237.1 MEGF6 gene_id:1953|Hs108|chr1 (1541) 888 85.5 2.2e-15
CCDS5313.1 DLL1 gene_id:28514|Hs108|chr6 ( 723) 858 82.7 7e-15
CCDS45232.1 DLL4 gene_id:54567|Hs108|chr15 ( 685) 839 81.2 1.9e-14
CCDS53454.1 CRB1 gene_id:23418|Hs108|chr1 (1294) 792 78.0 3.3e-13
CCDS7453.1 SLIT1 gene_id:6585|Hs108|chr10 (1534) 788 77.8 4.4e-13
CCDS64311.1 SLIT3 gene_id:6586|Hs108|chr5 (1530) 776 76.9 8.4e-13
CCDS75111.1 SLIT2 gene_id:9353|Hs108|chr4 (1521) 767 76.2 1.3e-12
CCDS75110.1 SLIT2 gene_id:9353|Hs108|chr4 (1525) 767 76.2 1.3e-12
CCDS3426.1 SLIT2 gene_id:9353|Hs108|chr4 (1529) 767 76.2 1.4e-12
CCDS4369.1 SLIT3 gene_id:6586|Hs108|chr5 (1523) 764 75.9 1.6e-12
CCDS10213.2 MEGF11 gene_id:84465|Hs108|chr15 (1044) 707 71.3 2.7e-11
CCDS72880.1 NOTCH2NL gene_id:388677|Hs108|chr1 ( 236) 688 68.9 3.2e-11
CCDS12537.1 DLL3 gene_id:10683|Hs108|chr19 ( 587) 691 69.7 4.5e-11
CCDS12538.1 DLL3 gene_id:10683|Hs108|chr19 ( 618) 691 69.8 4.7e-11
CCDS74370.1 LTBP4 gene_id:8425|Hs108|chr19 (1557) 691 70.3 7.8e-11
CCDS74368.1 LTBP4 gene_id:8425|Hs108|chr19 (1587) 691 70.4 7.9e-11
CCDS74369.1 LTBP4 gene_id:8425|Hs108|chr19 (1624) 691 70.4 8e-11
>>CCDS12326.1 NOTCH3 gene_id:4854|Hs108|chr19 (2321 aa)
initn: 17489 init1: 17489 opt: 17489 Z-score: 7282.6 bits: 1361.5 E(32554): 0
Smith-Waterman score: 17489; 100.0% identity (100.0% similar) in 2321 aa overlap (1-2321:1-2321)
10 20 30 40 50 60
pF1KB4 MGPGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCTQLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MGPGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCTQLPS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 REAACLCPPGWVGERCQLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 REAACLCPPGWVGERCQLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 DPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 FRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 PGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 VCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPC
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 HEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 HEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 RGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPCVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPCVN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 GGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGT
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 LCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHGGKCLDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHGGKCLDL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 VDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLCNVEINE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLCNVEINE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 CASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPGGFRCVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPGGFRCVC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 EPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCELLSPCTPNPC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCELLSPCTPNPC
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 EHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 EHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 YTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 YTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 CTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 HEADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 HEADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB4 YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSH
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB4 CEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB4 VARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGL
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB4 RCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQ
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB4 CRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 CRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLS
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB4 GPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPE
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB4 VSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQCEALQCWRLFNNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQCEALQCWRLFNNS
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB4 RCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLDC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLDC
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB4 ASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYHR
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB4 PSPGSEPRARRELAPEVIGSVVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PSPGSEPRARRELAPEVIGSVVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERL
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KB4 DFPYPLRDVRGEPLEPPEPSVPLLPLLVAGAVLLLVILVLGVMVARRKREHSTLWFPEGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DFPYPLRDVRGEPLEPPEPSVPLLPLLVAGAVLLLVILVLGVMVARRKREHSTLWFPEGF
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KB4 SLHKDVASGHKGRREPVGQDALGMKNMAKGESLMGEVATDWMDTECPEAKRLKVEEPGMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SLHKDVASGHKGRREPVGQDALGMKNMAKGESLMGEVATDWMDTECPEAKRLKVEEPGMG
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KB4 AEEAVDCRQWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AEEAVDCRQWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCG
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KB4 GALEPMPTEEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GALEPMPTEEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLD
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KB4 AGADTNAQDHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AGADTNAQDHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEG
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KB4 MVEELIASHADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MVEELIASHADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAA
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KB4 REGSYEAAKLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPPGPHGLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 REGSYEAAKLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPPGPHGLG
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KB4 PLLCPPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGPRGRGKKLTLACPGPLADSSVTLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PLLCPPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGPRGRGKKLTLACPGPLADSSVTLS
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KB4 PVDSLDSPRPFGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PVDSLDSPRPFGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSL
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KB4 GLLNPVAVPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GLLNPVAVPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEE
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KB4 YPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATATGAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 YPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATATGAM
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320
pF1KB4 ATTTGALPAQPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA
:::::::::::::::::::::::::::::::::::::::::
CCDS12 ATTTGALPAQPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA
2290 2300 2310 2320
>>CCDS43905.1 NOTCH1 gene_id:4851|Hs108|chr9 (2555 aa)
initn: 5566 init1: 3565 opt: 5428 Z-score: 2273.1 bits: 434.7 E(32554): 2.7e-120
Smith-Waterman score: 8800; 51.2% identity (72.2% similar) in 2381 aa overlap (33-2293:52-2369)
10 20 30 40 50 60
pF1KB4 PGARGRRRRRRPMSPPPPPPPVRALPLLLLLAGPGAAAP-PCLDGSPCANGGRCTQLPSR
..:: : :::. .:: :.: : . :
CCDS43 PRCSQPGETCLNGGKCEAANGTEACVCGGAFVGPRCQDPNPCLS-TPCKNAGTCHVVDRR
30 40 50 60 70 80
70 80 90 100 110
pF1KB4 ---EAACLCPPGWVGERC--QLEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPD
. :: : :. : : :.. : ..:: . :.:. . ....:::: :. : .
CCDS43 GVADYACSCALGFSGPLCLTPLDNACLTNPCRNGGTCD---LLTLTEYKCRCPPGWSGKS
90 100 110 120 130
120 130 140 150 160 170
pF1KB4 CSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGE-P--CRHGGT
:. ::: :.:::.:..: . .. ..: :::...: .::.::.:: :. : ::::::
CCDS43 CQQADPCASNPCANGGQC-LPFEASYICHCPPSFHGPTCRQDVNEC--GQKPGLCRHGGT
140 150 160 170 180 190
180 190 200 210 220 230
pF1KB4 CLNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNC
: : ::.:: : : .::: :: : :::.::::.:::::: .::.:..::::::: ::::
CCDS43 CHNEVGSYRCVCRATHTGPNCERPYVPCSPSPCQNGGTCRPTGDVTHECACLPGFTGQNC
200 210 220 230 240 250
240 250 260 270 280 290
pF1KB4 EVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFN
: :.:::::. : :::.::::::::::.::::::::.::::::::::.::::.::::: :
CCDS43 EENIDDCPGNNCKNGGACVDGVNTYNCRCPPEWTGQYCTEDVDECQLMPNACQNGGTCHN
260 270 280 290 300 310
300 310 320 330 340 350
pF1KB4 TLGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDD
: ::..::::::::::.::.::::::.:.:::::::::::::::: :: :.:::::::.:
CCDS43 THGGYNCVCVNGWTGEDCSENIDDCASAACFHGATCHDRVASFYCECPHGRTGLLCHLND
320 330 340 350 360 370
360 370 380 390 400 410
pF1KB4 ACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSIGANPCEHLGRCVNTQG
::.::::.: . ::::::::.:::::: :.:: ::.:::::::.::::::: :.:.:: :
CCDS43 ACISNPCNEGSNCDTNPVNGKAICTCPSGYTGPACSQDVDECSLGANPCEHAGKCINTLG
380 390 400 410 420 430
420 430 440 450 460 470
pF1KB4 SFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDEC
:: ::: .:::::::: :::::.:.::.:.:::::.::.: :::: :. :..:::. :::
CCDS43 SFECQCLQGYTGPRCEIDVNECVSNPCQNDATCLDQIGEFQCICMPGYEGVHCEVNTDEC
440 450 460 470 480 490
480 490 500 510 520 530
pF1KB4 QSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRC
::::...: : :..: :.: ::.::.: :: ::::::::::.:::::.: :. : : :
CCDS43 ASSPCLHNGRCLDKINEFQCECPTGFTGHLCQYDVDECASTPCKNGAKCLDGPNTYTCVC
500 510 520 530 540 550
540 550 560 570 580 590
pF1KB4 AEGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRH
.::. :: :. ..:.:.:::::.: : ::.:.:.: : ::::: .::....:: ::::::
CCDS43 TEGYTGTHCEVDIDECDPDPCHYGSCKDGVATFTCLCRPGYTGHHCETNINECSSQPCRH
560 570 580 590 600 610
600 610 620 630 640 650
pF1KB4 GGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPL
:: : : . ::: : .:::: :::.:.:::::.:: :.: : :. :.:.:.::.:: .
CCDS43 GGTCQDRDNAYLCFCLKGTTGPNCEINLDDCASSPCDSGTCLDKIDGYECACEPGYTGSM
620 630 640 650 660 670
660 670 680 690 700 710
pF1KB4 CNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAP
::..:.:::..:: .::.: :: ::: : :: : : :: . : .:: :: : :.
CCDS43 CNINIDECAGNPCHNGGTCEDGINGFTCRCPEGYHDPTCLSEVNECNSNPCVHGACRDSL
680 690 700 710 720 730
720 730 740 750 760 770
pF1KB4 GGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCE---
.:..: :.::::: : .. . :::.:: ::::.. :. ::: : .: .:.
CCDS43 NGYKCDCDPGWSGTNC--DINNNECESNPCVNGGTCKDMTSGYVCTCREGFSGPNCQTNI
740 750 760 770 780 790
780 790
pF1KB4 ------------------------------------LLSPCTPNPCEHGGRC-ESAPGQL
.:.::.:.::..::.: .: .
CCDS43 NECASNPCLNQGTCIDDVAGYKCNCLLPYTGATCEVVLAPCAPSPCRNGGECRQSEDYES
800 810 820 830 840 850
800 810 820 830 840 850
pF1KB4 PVCSCPQGWQGPRCQQDVDECAGPAPCGPHGI-CTNLAGSFSCTCHGGYTGPSCDQDIND
: :: :::: :. :..::. .:: :: : : :.. : :..::.: .:. ::.:
CCDS43 FSCVCPTGWQGQTCEVDINECVL-SPCR-HGASCQNTHGGYRCHCQAGYSGRNCETDIDD
860 870 880 890 900 910
860 870 880 890 900 910
pF1KB4 CDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCT
: :::: ::::: ::... :.::::: : : .:..:: :.:: :. ::: : :.:::
CCDS43 CRPNPCHNGGSCTDGINTAFCDCLPGFRGTFCEEDINECASDPCRNGANCTDCVDSYTCT
920 930 940 950 960 970
920 930 940 950 960 970
pF1KB4 CPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPC
:: :..:.:::.. :::. ::::::::::::.:::.::: ::.::..:::... : :.::
CCDS43 CPAGFSGIHCENNTPDCTESSCFNGGTCVDGINSFTCLCPPGFTGSYCQHDVNECDSQPC
980 990 1000 1010 1020 1030
980 990 1000 1010 1020
pF1KB4 LHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAY--CLCPPGWS
::::.:. . ..:::: ...:::.::.:: ::. .::.:::.: :: . : :: ::.
CCDS43 LHGGTCQDGCGSYRCTCPQGYTGPNCQNLVHWCDSSPCKNGGKCWQTHTQYRCECPSGWT
1040 1050 1060 1070 1080 1090
1030 1040 1050 1060 1070 1080
pF1KB4 GRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCL
: ::. :. :. :: . :: . .::: :: ::: ..:.: : : :::.::. :: :
CCDS43 GLYCDVPSVSCEVAAQRQGVDVARLCQHGGLCVDAGNTHHCRCQAGYTGSYCEDLVDECS
1100 1110 1120 1130 1140 1150
1090 1100 1110 1120 1130 1140
pF1KB4 AQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCP
.:::.:.:: :.::: :.:. ::.: :: ...::: :.:::.::.:.:: : ::::
CCDS43 PSPCQNGATCTDYLGGYSCKCVAGYHGVNCSEEIDECLSHPCQNGGTCLDLPNTYKCSCP
1160 1170 1180 1190 1200 1210
1150 1160 1170 1180 1190 1200
pF1KB4 PGTLGVLCEINEDDCGPG-PPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGLRCEADINE
:: :: :::: :::.: :.. .:.:..:::::: :::. ::::::..: :::.:.::
CCDS43 RGTQGVHCEINVDDCNPPVDPVSRSPKCFNNGTCVDQVGGYSCTCPPGFVGERCEGDVNE
1220 1230 1240 1250 1260 1270
1210 1220 1230 1240 1250 1260
pF1KB4 CRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQCRPSPGPG
: :. : : :..:.: . :.: :.:: .: ::..:.. :...::..:: : . . .
CCDS43 CLSNPCDARGTQNCVQRVND-FHCECRAGHTGRRCESVINGCKGKPCKNGGTCAVASNTA
1280 1290 1300 1310 1320
1270 1280 1290 1300 1310 1320
pF1KB4 GGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFP
: : :.: : : :: ::.: :.: : : . ::.: : : ..:: :. ::
CCDS43 RG--FICKCPAGFEGATCENDARTCGSLRCLNGGTCISGPRSPTCLCLGPFTGPECQ-FP
1330 1340 1350 1360 1370 1380
1330 1340 1350 1360 1370
pF1KB4 GSPPGASNASC-AAAPCLHGGSCRPAPLAPFFRCACAQGWTGPRCE---------APAAA
.: : : .. :: . :.:.:. .::.:: : ..: :. :
CCDS43 ASSP------CLGGNPCYNQGTCEPTSESPFYRCLCPAKFNGLLCHILDYSFGGGAGRDI
1390 1400 1410 1420 1430 1440
1380 1390 1400 1410 1420 1430
pF1KB4 PEVSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLSVGDPWRQC-EALQCWRLF
: : : :: :.. :. .::. .::::::::::. .:::..: ..::::. :
CCDS43 PPPLIEEACELPECQEDAGNKVCSLQCNNHACGWDGGDCSLNFNDPWKNCTQSLQCWKYF
1450 1460 1470 1480 1490 1500
1440 1450 1460 1470 1480 1490
pF1KB4 NNSRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDG
....:: :.: .::.:.:::. . : :::.:..:: :::.::.::::::. :: :::
CCDS43 SDGHCDSQCNSAGCLFDGFDCQRA--EGQCNPLYDQYCKDHFSDGHCDQGCNSAECEWDG
1510 1520 1530 1540 1550
1500 1510 1520 1530 1540 1550
pF1KB4 LDCASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFP
:::: .:: :: :.::..::.:::.: :: ::..:: .:.:.. :. ::::: :.::
CCDS43 LDCAEHVPERLAAGTLVVVVLMPPEQLRNSSFHFLRELSRVLHTNVVFKRDAHGQQMIFP
1560 1570 1580 1590 1600 1610
1560 1570 1580
pF1KB4 YH------RPSP-------------------------GSEP-RARRELAP-EVIGSVVML
:. : : ::: : :::: : .: ::.:.:
CCDS43 YYGREEELRKHPIKRAAEGWAAPDALLGQVKASLLPGGSEGGRRRRELDPMDVRGSIVYL
1620 1630 1640 1650 1660 1670
1590 1600 1610 1620 1630 1640
pF1KB4 EIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLDFPYPLRDVRGEPLEPPEPSVPLL
::::: :.:. ...:: .: ..: .::::... :..:: .. :..: .::: :. :
CCDS43 EIDNRQCVQA--SSQCFQSATDVAAFLGALASLGSLNIPYKIEAVQSETVEPPPPA-QLH
1680 1690 1700 1710 1720 1730
1650 1660 1670 1680 1690 1700
pF1KB4 PLLVAGAVLLLVILV-LGVMVAR-RKREHSTLWFPEGFSLHKDVASGHKGRREPVGQDAL
. ::.:...:...: ::...: :.:.:. :::::::.. . ...: ::::.:.:..
CCDS43 FMYVAAAAFVLLFFVGCGVLLSRKRRRQHGQLWFPEGFKVSE---ASKKKRREPLGEDSV
1740 1750 1760 1770 1780 1790
1710 1720 1730 1740 1750
pF1KB4 GMKNM--AKGESLMGEVATDWMDTECPEAKRLKVEEPGM--GAEEAVDCRQWTQHHLVAA
:.: . :. .:: . ..: : . :.:... ::: . .. .: :::::.:: ::
CCDS43 GLKPLKNASDGALMDDNQNEWGDEDL-ETKKFRFEEPVVLPDLDDQTDHRQWTQQHLDAA
1800 1810 1820 1830 1840 1850
1760 1770 1780 1790 1800 1810
pF1KB4 DIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPTEEDEADDTSA
:.:.. ::: :::::..::: :::::::::::::::.:: ::.:: .::.: :. :
CCDS43 DLRMS-AMAPTPPQGEVDADCMDVNVRGPDGFTPLMIASCSGGGLETGNSEEEE--DAPA
1860 1870 1880 1890 1900
1820 1830 1840 1850 1860 1870
pF1KB4 SIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQDHSGRTPLHT
.:::.: :::.: .:::::::::::::::.:.:::::::.:.::.: ::. ::::::.
CCDS43 -VISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHA
1910 1920 1930 1940 1950 1960
1880 1890 1900 1910 1920 1930
pF1KB4 AVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIASHADVNAVDEL
::.::::::::::::::.::::::: ::.: ::::::::::::.:.:: :::::::::.:
CCDS43 AVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDL
1970 1980 1990 2000 2010 2020
1940 1950 1960 1970 1980 1990
pF1KB4 GKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAAKLLLDHFANR
::::::::::::::.:...:::::::::::...:::::::::::::::.::.::::::::
CCDS43 GKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANR
2030 2040 2050 2060 2070 2080
2000 2010 2020 2030 2040 2050
pF1KB4 EITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPP---GPHG----LGPLLCPPGAFLP
.::::.::::::.::::.:.:::::::. . ::: .: : :.: :: :...:
CCDS43 DITDHMDRLPRDIAQERMHHDIVRLLDEYNLVRSPQLHGAPLGGTPTLSPPLCSPNGYLG
2090 2100 2110 2120 2130 2140
2060 2070 2080 2090 2100
pF1KB4 GLKAAQSGSKKSRRPPGKAGLGPQGPRGRG----KKLTLACPGPLADSSVTLSPVDSLDS
.:: . .: :: :.: .: ::. . ... .: . : : ::: :::::::.:
CCDS43 SLKPGVQG-KKVRKPSSK-GLACGSKEAKDLKARRKKSQDGKGCLLDSSGMLSPVDSLES
2150 2160 2170 2180 2190 2200
2110 2120 2130 2140 2150 2160
pF1KB4 PRPFGGPPASPGGFPLEGPYAAATATAVSLAQLGGPGRAGLGRQPPGGCVLSLGLLNPVA
:. . . ::: .: .:. . . : : .: : . :: .: :: .:
CCDS43 PHGYLSDVASPPLLP--SPFQQSPS--VPLNHLPGMPDTHLG----------IGHLNVAA
2210 2220 2230 2240 2250
2170 2180 2190 2200 2210 2220
pF1KB4 VPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEEYPAAGAH
: . : : : . : . :: :. ::. . . : . .. ..:.
CCDS43 KP-EMAAL------GGGGRLAFETGPPRLSH-LPVA-SGTSTVLGSSSGGALNFTVGGST
2260 2270 2280 2290 2300
2230 2240 2250 2260 2270 2280
pF1KB4 SSPPKARFL-RVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTP----SPATATGAMAT
: . ..: :. : ..:. .: . .: .: :: . : .: .. : ..
CCDS43 SLNGQCEWLSRLQS---GMVPNQYNPLR-GSVAPGPLSTQAPSLQHGMVGPLHSSLAASA
2310 2320 2330 2340 2350
2290 2300 2310 2320
pF1KB4 TTGALPAQPLPLSVPSSLAQAQTQLGPQPEVTPKRQVLA
. . : ::
CCDS43 LSQMMSYQGLPSTRLATQPHLVQTQQVQPQNLQMQQQNLQPANIQQQQSLQPPPPPPQPH
2360 2370 2380 2390 2400 2410
>>CCDS908.1 NOTCH2 gene_id:4853|Hs108|chr1 (2471 aa)
initn: 5366 init1: 2003 opt: 5232 Z-score: 2191.9 bits: 419.6 E(32554): 9.1e-116
Smith-Waterman score: 8744; 51.2% identity (71.8% similar) in 2372 aa overlap (42-2297:67-2375)
20 30 40 50 60 70
pF1KB4 RRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCT-QLPSREAACLCPPG
:: . . : ::: :. : .:.: : :
CCDS90 NEGMCVTYHNGTGYCKCPEGFLGEYCQHRDPC-EKNRCQNGGTCVAQAMLGKATCRCASG
40 50 60 70 80 90
80 90 100 110 120
pF1KB4 WVGERCQLED--PCH-SGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLPDPCLSSP
..:: :: :: : :: . :.:. . . . : : :: : .:. : ::: :
CCDS90 FTGEDCQYSTSHPCFVSRPCLNGGTCH---MLSRDTYECTCQVGFTGKECQWTDACLSHP
100 110 120 130 140 150
130 140 150 160 170 180
pF1KB4 CAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPA
::.:. :.. . .: :.: :. :..:..::.:: . :.::::::: :::..::::
CCDS90 CANGSTCTTVAN-QFSCKCLTGFTGQKCETDVNECDIPGHCQHGGTCLNLPGSYQCQCPQ
160 170 180 190 200 210
190 200 210 220 230 240
pF1KB4 GYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDCPGHRCLN
:.:: :.. :::::::: :::::::.::.:..: :::::::..:: :.::::.::: :
CCDS90 GFTGQYCDSLYVPCAPSPCVNGGTCRQTGDFTFECNCLPGFEGSTCERNIDDCPNHRCQN
220 230 240 250 260 270
250 260 270 280 290 300
pF1KB4 GGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWT
::.::::::::::.:::.::::::::::::: ::::::.::::: : ::..:::::::.
CCDS90 GGVCVDGVNTYNCRCPPQWTGQFCTEDVDECLLQPNACQNGGTCANRNGGYGCVCVNGWS
280 290 300 310 320 330
310 320 330 340 350 360
pF1KB4 GESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPCHEDAICD
:..::.:::::: : : :.:: :::::: : :: ::.::::::::::.:::::. :.::
CCDS90 GDDCSENIDDCAFASCTPGSTCIDRVASFSCMCPEGKAGLLCHLDDACISNPCHKGALCD
340 350 360 370 380 390
370 380 390 400 410 420
pF1KB4 TNPVNGRAICTCPPGFTGGACDQDVDECSIG-ANPCEHLGRCVNTQGSFLCQCGRGYTGP
:::.::. ::::: :. :. : .:::::... .::::: :.::::.:.: :.: .::.::
CCDS90 TNPLNGQYICTCPQGYKGADCTEDVDECAMANSNPCEHAGKCVNTDGAFHCECLKGYAGP
400 410 420 430 440 450
430 440 450 460 470 480
pF1KB4 RCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEVDIDECQSSPCVNGGVCKD
::: :.::: : ::.:.:::::.:: :::.:: :: :..::..:.::::.::::.: : :
CCDS90 RCEMDINECHSDPCQNDATCLDKIGGFTCLCMPGFKGVHCELEINECQSNPCVNNGQCVD
460 470 480 490 500 510
490 500 510 520 530 540
pF1KB4 RVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGTLCDRNV
.:: :.: :: ::.: .::.:.:.:.:::: :::::.:.:.::::.:: :: :.::..:.
CCDS90 KVNRFQCLCPPGFTGPVCQIDIDDCSSTPCLNGAKCIDHPNGYECQCATGFTGVLCEENI
520 530 540 550 560 570
550 560 570 580 590 600
pF1KB4 DDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRSQPCRHGGKCLDLVDKYLC
:.:.:::::::.: ::: :..: : ::: :. : .:.::: :.:: . :.:.:::. : :
CCDS90 DNCDPDPCHHGQCQDGIDSYTCICNPGYMGAICSDQIDECYSSPCLNDGRCIDLVNGYQC
580 590 600 610 620 630
610 620 630 640 650 660
pF1KB4 RCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPC
: ::.:::::.:.:::::::: :.: ::::::.:::.::::: ::..:.::::.::
CCDS90 NCQPGTSGVNCEINFDDCASNPCIHGICMDGINRYSCVCSPGFTGQRCNIDIDECASNPC
640 650 660 670 680 690
670 680 690 700 710 720
pF1KB4 GEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPGGFRCVCEPGWSG
.:..:..: :::::.:: : : : . : .:: :: : . .:..:.:. :: :
CCDS90 RKGATCINGVNGFRCICPEGPHHPSCYSQVNECLSNPCIHGNCTGGLSGYKCLCDAGWVG
700 710 720 730 740 750
730 740 750 760 770
pF1KB4 PRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCEL---------------
: . .. : :.::. ::::.. :..::: : .: .:..
CCDS90 INC--EVDKNECLSNPCQNGGTCDNLVNGYRCTCKKGFKGYNCQVNIDECASNPCLNQGT
760 770 780 790 800
780 790 800
pF1KB4 ------------------------LSPCTPNPCEHGGRCESAPG-QLPVCSCPQGWQGPR
:.::.:::::... :. .:. . .: : :::: :
CCDS90 CFDDISGYTCHCVLPYTGKNCQTVLAPCSPNPCENAAVCKESPNFESYTCLCAPGWQGQR
810 820 830 840 850 860
810 820 830 840 850 860
pF1KB4 CQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDCDPNPCLNGGSCQD
: :.::: . :: ::.: : ::. : : :..: .:..::.:: ::: :::::.:
CCDS90 CTIDIDECISK-PCMNHGLCHNTQGSYMCECPPGFSGMDCEEDIDDCLANPCQNGGSCMD
870 880 890 900 910 920
870 880 890 900 910 920
pF1KB4 GVGSFSCSCLPGFAGPRCARDVDECLSNPC-GPGTCTDHVASFTCTCPPGYGGFHCEQDL
::..::: :::::.: .: :..::::.:: . :::.:.: :.:: : :. : :::...
CCDS90 GVNTFSCLCLPGFTGDKCQTDMNECLSEPCKNGGTCSDYVNSYTCKCQAGFDGVHCENNI
930 940 950 960 970 980
930 940 950 960 970 980
pF1KB4 PDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLHGGVCSAAHPGFR
.:. ::::::::::::.::::::: :.::. : :: . : :.:::. :.: . .:
CCDS90 NECTESSCFNGGTCVDGINSFSCLCPVGFTGSFCLHEINECSSHPCLNEGTCVDGLGTYR
990 1000 1010 1020 1030 1040
990 1000 1010 1020 1030 1040
pF1KB4 CTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGA--YCLCPPGWSGRLCDIRSLPCREA
:.: ..:: .:::::. :::.::.: : ::: : :::: ::.: ::. .. : :
CCDS90 CSCPLGYTGKNCQTLVNLCSRSPCKNKGTCVQKKAESQCLCPSGWAGAYCDVPNVSCDIA
1050 1060 1070 1080 1090 1100
1050 1060 1070 1080 1090 1100
pF1KB4 AAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYM
:.. :: .:.::: .: :.. ..::: :: : :::.::...: : ..:::::.:: ..
CCDS90 ASRRGVLVEHLCQHSGVCINAGNTHYCQCPLGYTGSYCEEQLDECASNPCQHGATCSDFI
1110 1120 1130 1140 1150 1160
1110 1120 1130 1140 1150 1160
pF1KB4 GGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCPPGTLGVLCEINEDD
::: :::.:::.: ::: .:::: .::::.::.::::: .. ::::::: :.::: : ::
CCDS90 GGYRCECVPGYQGVNCEYEVDECQNQPCQNGGTCIDLVNHFKCSCPPGTRGLLCEENIDD
1170 1180 1190 1200 1210 1220
1170 1180 1190 1200 1210 1220
pF1KB4 CGPGPPLDSGPRCLHNGTCVDLVGGFRCTCPPGYTGLRCEADINECRSGACHAAHTRDCL
:. ::.::..: :.: .::. : : ::..: :::.::::: :. : . . ::.
CCDS90 CA------RGPHCLNGGQCMDRIGGYSCRCLPGFAGERCEGDINECLSNPCSSEGSLDCI
1230 1240 1250 1260 1270 1280
1230 1240 1250 1260 1270 1280
pF1KB4 QDPGGGFRCLCHAGFSGPRCQTVLSPCESQPCQHGGQCR-PSPGPGGGLTFTCHCAQPFW
: . . :.:...:.: .:.: .. : ..:: .:: : : : : : :.: :
CCDS90 QLTND-YLCVCRSAFTGRHCETFVDVCPQMPCLNGGTCAVASNMPDG---FICRCPPGFS
1290 1300 1310 1320 1330
1290 1300 1310 1320 1330 1340
pF1KB4 GPRCERVARSCRELQCPVGVPCQQTPRGPRCACPPGLSGPSCRSFPGSPPGASNASCAAA
: ::. :: ...: : : .: :::: :: : .:.: .::..
CCDS90 GARCQS---SCGQVKCRKGEQCVHTASGPRCFCP---SPRDCES-----------GCASS
1340 1350 1360 1370 1380
1350 1360 1370 1380 1390 1400
pF1KB4 PCLHGGSCRPAPLAPFFRCACAQGWTGPRCEAPAAAPEVSEEP-RCPRAACQAKRGDQRC
:: :::::.: :.. : :: ..: ::: .: : : : : : : : :
CCDS90 PCQHGGSCHPQRQPPYYSCQCAPPFSGSRCELYTAPP--STPPATCLSQYCADKARDGVC
1390 1400 1410 1420 1430
1410 1420 1430 1440 1450 1460
pF1KB4 DRECNSPGCGWDGGDCSLSVGDPWRQCEA-LQCWRLFNNSRCDPACSSPACLYDNFDCHA
:. ::: .: ::::::::.. .:: .: . : :: .:: .:: :.. ::.:::.:.
CCDS90 DEACNSHACQWDGGDCSLTMENPWANCSSPLPCWDYINN-QCDELCNTVECLFDNFECQ-
1440 1450 1460 1470 1480 1490
1470 1480 1490 1500 1510 1520
pF1KB4 GGRERTCNPVYEKYCADHFADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLP
: .::. :.::::::: :..::::::.:::::::::::.. : ::.:.::..::.:
CCDS90 -GNSKTCK--YDKYCADHFKDNHCDQGCNSEECGWDGLDCAADQPENLAEGTLVIVVLMP
1500 1510 1520 1530 1540 1550
1530 1540 1550 1560 1570
pF1KB4 PEELLRSSADFLQRLSAILRTSLRFRLDAHGQAMVFPYH--RPSPGSEPRARRELAP---
::.::... .::. :...:.:.::.. :..:. ::.::. . . .. : :. :
CCDS90 PEQLLQDARSFLRALGTLLHTNLRIKRDSQGELMVYPYYGEKSAAMKKQRMTRRSLPGEQ
1560 1570 1580 1590 1600 1610
1580 1590 1600 1610 1620 1630
pF1KB4 --EVIGSVVMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLDFPYPLRDVRGEP
:: :: :.:::::: :.: ..:::: ....:: : : :.. . ::: .: .:
CCDS90 EQEVAGSKVFLEIDNRQCVQ--DSDHCFKNTDAAAALL-ASHAIQGT-LSYPLVSVVSES
1620 1630 1640 1650 1660 1670
1640 1650 1660 1670 1680 1690
pF1KB4 LEPPEPSVPLLPLLVAGAVLLLVILVLGVMVARRKREHSTLWFPEGFSLHKDVASGHKGR
: : . . :: ::....:..: :..:::..:.:::.:..::.::::.:..: ::.:: :
CCDS90 LTPERTQ--LLYLLAVAVVIILFIILLGVIMAKRKRKHGSLWLPEGFTLRRD-ASNHK-R
1680 1690 1700 1710 1720
1700 1710 1720 1730 1740
pF1KB4 REPVGQDALGMKNMAKGES---LMGEVATD-WMDTECPEAKRLKVEEPGMGAEE--AVDC
::::::::.:.::.. : :.: ... :.: : :. :..:.:. .. .:: .:
CCDS90 REPVGQDAVGLKNLSVQVSEANLIGTGTSEHWVDDEGPQPKKVKAEDEALLSEEDDPIDR
1730 1740 1750 1760 1770 1780
1750 1760 1770 1780 1790 1800
pF1KB4 RQWTQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMP
: :::.:: ::::: .:..::::::.. ..: .::::::::: :::::::. ::. . .
CCDS90 RPWTQQHLEAADIRRTPSLALTPPQAEQEVDVLDVNVRGPDGCTPLMLASLRGGSSD-LS
1790 1800 1810 1820 1830 1840
1810 1820 1830 1840 1850 1860
pF1KB4 TEEDEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNA
:...:.:.::.::.::. :::.: :.:::::: ::::::::.::::::::::::::.::
CCDS90 DEDEDAEDSSANIITDLVYQGASLQAQTDRTGEMALHLAARYSRADAAKRLLDAGADANA
1850 1860 1870 1880 1890 1900
1870 1880 1890 1900 1910 1920
pF1KB4 QDHSGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIA
::. :: :::.::.:::::::::::::: ::::::: ::.: ::::::::::::: :::
CCDS90 QDNMGRCPLHAAVAADAQGVFQILIRNRVTDLDARMNDGTTPLILAARLAVEGMVAELIN
1910 1920 1930 1940 1950 1960
1930 1940 1950 1960 1970 1980
pF1KB4 SHADVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEA
.:::::::. :::::::::::::::::: :::::::.::::.:::::::::::::::::
CCDS90 CQADVNAVDDHGKSALHWAAAVNNVEATLLLLKNGANRDMQDNKEETPLFLAAREGSYEA
1970 1980 1990 2000 2010 2020
1990 2000 2010 2020 2030 2040
pF1KB4 AKLLLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGPRSPPGP---HGLGPLLC
::.::::::::.::::.::::::::..:.:.:::::::. . :::: .:.:..:
CCDS90 AKILLDHFANRDITDHMDRLPRDVARDRMHHDIVRLLDEYNVTPSPPGTVLTSALSPVIC
2030 2040 2050 2060 2070 2080
2050 2060 2070 2080 2090
pF1KB4 PPGAFLPGLKAAQSGSKKSRRPPGKAGLGPQGP---------RGRGKKLTLACPGPLADS
:. . .:: . : :::::: .:. . . : .: .: .:. :..:
CCDS90 GPNRSFLSLKHTPMG-KKSRRPSAKSTMPTSLPNLAKEAKDAKGSRRKKSLSEKVQLSES
2090 2100 2110 2120 2130 2140
2100 2110 2120 2130 2140
pF1KB4 SVTLSPVDSLDSPRPF----GGPP--ASPGGF-----PL---EGPYAAATAT-AVSLAQL
::::::::::.::. . . : .::: . :. .: : . : :.:...:
CCDS90 SVTLSPVDSLESPHTYVSDTTSSPMITSPGILQASPNPMLATAAPPAPVHAQHALSFSNL
2150 2160 2170 2180 2190 2200
2150 2160 2170 2180
pF1KB4 --------GG----PGRAGLGRQ-----PPGGCVLSLGLLNPVAVPLDWA-RLP-PPAPP
:. :. . : . : .: . ::. :.:: :: :: :. .
CCDS90 HEMQPLAHGASTVLPSVSQLLSHHHIVSPGSGSAGSLSRLHPVPVPADWMNRMEVNETQY
2210 2220 2230 2240 2250 2260
2190 2200 2210 2220 2230 2240
pF1KB4 GPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGHGEEYPAAGAHSSPPKARFLRVPS-
. : . :::. . .:: ..:: ::: :. : . :: . : .:.
CCDS90 NEMFGMVLAPA-EGTHPG--IAPQSRPPE-----GKHITTPR---EPLPPIVTFQLIPKG
2270 2280 2290 2300 2310
2250 2260 2270 2280 2290
pF1KB4 --EHPYLTPSPESPEHWASPSP-PSLSDWSEST--PSPATATGAMATTTGALPAQPLPLS
.: .:.:.: : .: :.. . : . :: : :. : : . ::
CCDS90 SIAQPAGAPQPQSTCPPAVAGPLPTMYQIPEMARLPSVAFPTAMMPQQDGQVAQTILPAY
2320 2330 2340 2350 2360 2370
2300 2310 2320
pF1KB4 VPSSLAQAQTQLGPQPEVTPKRQVLA
:
CCDS90 HPFPASVGKYPTPPSQHSYASSNAAERTPSHSGHLQGEHPYLTPSPESPDQWSSSSPHSA
2380 2390 2400 2410 2420 2430
>>CCDS34420.1 NOTCH4 gene_id:4855|Hs108|chr6 (2003 aa)
initn: 2955 init1: 730 opt: 2443 Z-score: 1034.5 bits: 205.1 E(32554): 2.7e-51
Smith-Waterman score: 5306; 38.9% identity (57.7% similar) in 2241 aa overlap (42-2208:67-1994)
20 30 40 50 60
pF1KB4 RRPMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGGRCTQL-------PSREAA
:: ... : ::: : : :: .
CCDS34 NGGTCLSLSLGQGTCQCAPGFLGETCQFPDPCQNAQLCQNGGSCQALLPAPLGLPSSPSP
40 50 60 70 80 90
70 80 90 100 110
pF1KB4 ------CLCPPGWVGERCQ--LEDPCHSGPCAGRGVCQSSVVAGTARFSCRCPRGFRGPD
: : ::..::::: ::::: . :. :: :. . ...: .: : :. : .
CCDS34 LTPSFLCTCLPGFTGERCQAKLEDPCPPSFCSKRGRCH---IQASGRPQCSCMPGWTGEQ
100 110 120 130 140 150
120 130 140 150 160 170
pF1KB4 CSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQGRSCRSDVDECRVGE-PCRHGGTCL
:.: : : ..::..:. : .. .. : ::::..:..:. ::.:: :: .: .:
CCDS34 CQLRDFCSANPCVNGGVC-LATYPQIQCHCPPGFEGHACERDVNECFQDPGPCPKGTSCH
160 170 180 190 200 210
180 190 200 210 220 230
pF1KB4 NTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCR--QSGDLTYD-CACLPGFEGQN
:: :::.: ::.: :: :: : :: : : :::::. : :. : : ::: : .
CCDS34 NTLGSFQCLCPVGQEGPRCELRAGPCPPRGCSNGGTCQLMPEKDSTFHLCLCPPGFIGPD
220 230 240 250 260 270
240 250 260 270 280 290
pF1KB4 CEVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQ-PNACHNGGTC
:::: :.: .:.: ::::: ::..::.: :: ::: :.::::::. : : :.:::::
CCDS34 CEVNPDNCVSHQCQNGGTCQDGLDTYTCLCPETWTGWDCSEDVDECETQGPPHCRNGGTC
280 290 300 310 320 330
300 310 320 330 340 350
pF1KB4 FNTLGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHL
:. :. ::::.:: : :: .:.::: .:.: :.:: :::.:: : :: :.:::::::
CCDS34 QNSAGSFHCVCVSGWGGTSCEENLDDCIAATCAPGSTCIDRVGSFSCLCPPGRTGLLCHL
340 350 360 370 380 390
360 370 380 390 400
pF1KB4 DDACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSI---GANPCEHLGRC
.: :.:.::: :: :.:::..: ..: : ::..: .: ::.::: . : .:::: : :
CCDS34 EDMCLSQPCHGDAQCSTNPLTGSTLCLCQPGYSGPTCHQDLDECLMAQQGPSPCEHGGSC
400 410 420 430 440 450
410 420 430 440 450 460
pF1KB4 VNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFTGTYCEV
.:: ::: : : :::: :::.: ::::: ::. .:::: .. : :.: :. : :::
CCDS34 LNTPGSFNCLCPPGYTGSRCEADHNECLSQPCHPGSTCLDLLATFHCLCPPGLEGQLCEV
460 470 480 490 500 510
470 480 490 500 510 520
pF1KB4 DIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDG
. .:: :.::.: . :.: .:::.: : ::::. :. :.::: :.:: ::..: ::: .
CCDS34 ETNECASAPCLNHADCHDLLNGFQCICLPGFSGTRCEEDIDECRSSPCANGGQCQDQPGA
520 530 540 550 560 570
530 540 550 560 570 580
pF1KB4 YECRCAEGFEGTLCDRNVDDCSPDPCHHGRCVDGIASFSCACAPGYTGTRCESQVDECRS
..:.: :::: : ::...:::: :
CCDS34 FHCKCLPGFEG-------------P------------------------RCQTEVDECLS
580 590
590 600 610 620 630 640
pF1KB4 QPCRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPG
.:: :..:::: ..: :::: :: ::: . :: : .:::
CCDS34 DPCPVGASCLDLPGAFFCLCPSGFTGQLCEVPL--CAPN----------------LCQPK
600 610 620 630
650 660 670 680 690 700
pF1KB4 FTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSHGI
.: : : .. :::: :: : : :: :. : ::
CCDS34 --------QI-------------CKDQKDKANCLCPDGS--PGCAPPEDNCT---CHHGH
640 650 660 670
710 720 730 740 750 760
pF1KB4 CYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQ
: . :::. ::.::.: : ::
CCDS34 CQRSS----CVCDVGWTGPECEAEL------------GG---------------------
680 690
770 780 790 800 810 820
pF1KB4 CELLSPCTPNPCEHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECAGPAPCGPHGICTN
: :: ::: : : : :
CCDS34 ------CISAPCAHGGTCY-----------------------------PQPSG-------
700 710
830 840 850 860 870 880
pF1KB4 LAGSFSCTCHGGYTGPSCDQDINDCDPNPCLNGGSCQDGVGSFSCSCLPGFAGPRCARDV
..::: :::::.:..... : .::::::::. . :.. :.: :. .::.: ..
CCDS34 ----YNCTCPTGYTGPTCSEEMTACHSGPCLNGGSCNPSPGGYYCTCPPSHTGPQCQTST
720 730 740 750 760
890 900 910 920 930 940
pF1KB4 DECLSNPCGPGTCTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNGGTCVDGVNSFSC
: :.: :: :::::::. ..:::
CCDS34 DYCVSAPC-------------------------------------FNGGTCVNRPGTFSC
770 780 790
950 960 970 980 990 1000
pF1KB4 LCRPGYTGAHCQHEADP-CLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQ
:: :. : .:. . : : . :: . ..:. . : :: : ..:: .::::.: :...
CCDS34 LCAMGFQGPRCEGKLRPSCADSPCRNRATCQDSPQGPRCLCPTGYTGGSCQTLMDLCAQK
800 810 820 830 840 850
1010 1020 1030 1040 1050 1060
pF1KB4 PCQNGGRCVQTGA--YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDED
:: ...:.::: .::: ::.: ::.. :..:: . :. . .::. :: :::
CCDS34 PCPRNSHCLQTGPSFHCLCLQGWTGPLCNLPLSSCQKAALSQGIDVSSLCHNGGLCVDSG
860 870 880 890 900 910
1070 1080 1090 1100 1110 1120
pF1KB4 SSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDE
:..: :: : :: :...:.:: ..:::.:.:: . .::.:.: :::.:.:: ..:
CCDS34 PSYFCHCPPGFQGSLCQDHVNPCESRPCQNGATCMAQPSGYLCQCAPGYDGQNCSKELDA
920 930 940 950 960 970
1130 1140 1150 1160 1170 1180
pF1KB4 CASQPCQHGGSCIDLVARYLCSCPPGTLGVLCEINEDDCGPGPPLDSGPRCLHNGTCVDL
: ::::.. :.: : :
CCDS34 CQSQPCHNHGTCT---------------------------PKP-----------------
980
1190 1200 1210 1220 1230 1240
pF1KB4 VGGFRCTCPPGYTGLRCEADINECRSGACHAAHTRDCLQDPGGGFRCLCHAGFSGPRCQT
:::.:.::::..:::::.:..:: . :: . : : .. ...: : : : .: :..
CCDS34 -GGFHCACPPGFVGLRCEGDVDECLDQPCHPTGTAAC-HSLANAFYCQCLPGHTGQWCEV
990 1000 1010 1020 1030 1040
1250 1260 1270 1280 1290 1300
pF1KB4 VLSPCESQPCQHGGQCRPSPGPGGGLTFTCHCAQPFWGPRCERVARSCRELQCPVGVPCQ
..::.:::: ::: :. . :. : : ::: . : :: : . : :: .: : :
CCDS34 EIDPCHSQPCFHGGTCEATA--GSPLGFICHCPKGFEGPTCSHRAPSCGFHHCHHGGLCL
1050 1060 1070 1080 1090 1100
1310 1320 1330 1340 1350 1360
pF1KB4 QTPRG---PRCACPPGLSGPSCRSFPGSPPGASNASCAAAPCLHGGSCRPAPL--APFFR
.:. ::::: : .::.: . : .: : . : :::..::: . .: ::
CCDS34 PSPKPGFPPRCACLSGYGGPDCLT-PPAPKGCGPPS----PCLYNGSCSETTGLGGPGFR
1110 1120 1130 1140 1150
1370 1380 1390 1400 1410 1420
pF1KB4 CACAQGWTGPRCEAPAAAPEVSEEPRCPRAACQAKRGDQRCDRECNSPGCGWDGGDCSLS
:.: .. ::::. :.: .:... :: :: :..:: .::::::::.
CCDS34 CSCPHSSPGPRCQKPGAK------------GCEGRSGDGACDAGCSGPGGNWDGGDCSLG
1160 1170 1180 1190 1200
1430 1440 1450 1460 1470
pF1KB4 VGDPWRQCEAL-QCWRLFNNSRCDPACSSPACLYDNFDCHAGGRERTCNPVYEKYCADHF
: :::. : . .:: :: ...: : :.: ::.:..::.. .:.:.:..:: :::
CCDS34 VPDPWKGCPSHSRCWLLFRDGQCHPQCDSEECLFDGYDCETPP---ACTPAYDQYCHDHF
1210 1220 1230 1240 1250 1260
1480 1490 1500 1510 1520 1530
pF1KB4 ADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADFLQRLSAIL
.:.:..:::: :::::: :: : :.: :.: : : .. . . :: :
CCDS34 HNGHCEKGCNTAECGWDGGDCRPEDGDPEWGPSLALLVVLSPPALDQQLFALARVLSLTL
1270 1280 1290 1300 1310 1320
1540 1550 1560 1570 1580
pF1KB4 RTSLRFRLDAHGQAMVFPY------------------HRPSPGSEPRARRELAPEVIGSV
:..: : : :. ::.:: .: .: ..: .. : : :
CCDS34 RVGLWVRKDRDGRDMVYPYPGARAEEKLGGTRDPTYQERAAPQTQPLGK-ETDSLSAGFV
1330 1340 1350 1360 1370 1380
1590 1600 1610 1620 1630
pF1KB4 VMLEIDNRLCLQSPENDHCFPDAQSAADYLGALSAVERLD--FPYPLRDVRGEP-LEPPE
:.. .: : . ..: : .:.:..:: :. .: :: :. . ::
CCDS34 VVMGVDLSRCGPDHPASRCPWDPGLLLRFLAAMAAVGALEPLLPGPLLAVHPHAGTAPPA
1390 1400 1410 1420 1430 1440
1640 1650 1660 1670 1680 1690
pF1KB4 PSVPLLPLL---VAGAVLL-LVILVLGVMVARRKREHSTLWFPEGFSLHKDVASGHKGRR
..: :.: :::..:: : :.. .. ::.:::..::.: ::. . . :. . ::
CCDS34 NQLPW-PVLCSPVAGVILLALGALLVLQLIRRRRREHGALWLPPGFTRRPRTQSAPHRRR
1450 1460 1470 1480 1490 1500
1700 1710 1720 1730 1740 1750
pF1KB4 EPVGQDALGMKNMAKGESLMGEVATDWMDTEC--PEAKRLKVEEPGMGAEEA--VDCRQW
:.:.:..:.: . : .. :: : . . : :: . :: :.. : . :. :
CCDS34 PPLGEDSIGLKAL-KPKA---EVDEDGV-VMCSGPE----EGEEVGQAEETGPPSTCQLW
1510 1520 1530 1540 1550
1760 1770 1780 1790 1800 1810
pF1KB4 TQHHLVAADIRVAPAMALTPPQGDADADGMDVNVRGPDGFTPLMLASFCGGALEPMPTEE
. .: . : ::::: ... .. :...::::: :::: : :: : .
CCDS34 SLSGGCGA---LPQAAMLTPPQ-ESEMEAPDLDTRGPDGVTPLMSAVCCG---EVQSGTF
1560 1570 1580 1590 1600
1820 1830 1840 1850 1860 1870
pF1KB4 DEADDTSASIISDLICQGAQLGARTDRTGETALHLAARYARADAAKRLLDAGADTNAQDH
. : :. :: :.: :::: ::::::..: ::.:::.:::. : :.
CCDS34 QGAWLGCPEPWEPLLDGGACPQAHTVGTGETPLHLAARFSRPTAARRLLEAGANPNQPDR
1610 1620 1630 1640 1650 1660
1880 1890 1900 1910 1920 1930
pF1KB4 SGRTPLHTAVTADAQGVFQILIRNRSTDLDARMADGSTALILAARLAVEGMVEELIASHA
.::::::.::.:::. : :.:.:.:.: .::: ::.: :.:::::::: .::::::..:
CCDS34 AGRTPLHAAVAADAREVCQLLLRSRQTAVDARTEDGTTPLMLAARLAVEDLVEELIAAQA
1670 1680 1690 1700 1710 1720
1940 1950 1960 1970 1980 1990
pF1KB4 DVNAVDELGKSALHWAAAVNNVEATLALLKNGANKDMQDSKEETPLFLAAREGSYEAAKL
::.: :. ::.::::::::::..:. .::. ::.:: ::..:.::::::::::. :.:.:
CCDS34 DVGARDKWGKTALHWAAAVNNARAARSLLQAGADKDAQDNREQTPLFLAAREGAVEVAQL
1730 1740 1750 1760 1770 1780
2000 2010 2020 2030 2040
pF1KB4 LLDHFANREITDHLDRLPRDVAQERLHQDIVRLLDQPSGP----RSPPGPHGLGPLLCPP
:: : ::. :. : :::..: : :.. ::. . : .. :: .. ::. :
CCDS34 LLGLGAARELRDQAGLAPADVAHQRNHWDLLTLLEGAGPPEARHKATPGREA-GPF---P
1790 1800 1810 1820 1830 1840
2050 2060 2070 2080 2090 2100
pF1KB4 GAFLPGLKAA-QSGSKKSRRPPGKAGLGPQGP----RGRGKKLTLACPGPLADSSV-TLS
: .... ..:. : .:: ::.: ..: .. :: : : : .::
CCDS34 RARTVSVSVPPHGGGALPRCRTLSAGAGPRGGGACLQARTWSVDLAARGGGAYSHCRSLS
1850 1860 1870 1880 1890 1900
2110 2120 2130 2140 2150
pF1KB4 PVDSLDSPRPFGGPPASPGGFPLEGPYAAATATAVSLAQLG-GPGRAGLGRQPPGGC-VL
: . .: : : : : ..:: :. .. : . ::.: : .
CCDS34 GVGAGGGPTPRGRR-FSAG---MRGPRP---NPAIMRGRYGVAAGRGGRVSTDDWPCDWV
1910 1920 1930 1940 1950
2160 2170 2180 2190 2200 2210
pF1KB4 SLGLLNPVA-VPLDWARLPPPAPPGPSFLLPLAPGPQLLNPGTPVSPQERPPPYLAVPGH
.:: . .. .: .::: :: : .::: . : :. :: :
CCDS34 ALGACGSASNIP-----IPPPCLT-PS---PERGSPQL-DCGPPAL-QEMPINQGGEGKK
1960 1970 1980 1990 2000
2220 2230 2240 2250 2260 2270
pF1KB4 GEEYPAAGAHSSPPKARFLRVPSEHPYLTPSPESPEHWASPSPPSLSDWSESTPSPATAT
>>CCDS47445.1 EYS gene_id:346007|Hs108|chr6 (3144 aa)
initn: 968 init1: 968 opt: 1610 Z-score: 686.6 bits: 141.4 E(32554): 6.4e-32
Smith-Waterman score: 1849; 33.3% identity (57.7% similar) in 807 aa overlap (210-968:467-1247)
180 190 200 210 220 230
pF1KB4 SFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGF---EGQNCEVN
: :...: .. . :: ::..:.
CCDS47 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV
440 450 460 470 480 490
240 250 260 270 280 290
pF1KB4 VDD--CPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNT
.: . : . .: :. . : .: : . :... : :: .:..
CCDS47 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE
500 510 520 530 540
300 310 320 330 340 350
pF1KB4 LGG--HSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLD
. . .: :.:. .: : : : :.:.:.. :.: .. : :: ..
CCDS47 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN
550 560 570 580 590 600
360 370 380 390 400
pF1KB4 -DACVSNPC-HEDAICDTNPVNGRAICTCP--PGFTGGACDQDVDECSIGANPCEHLGRC
: :..: ..: . : :.: . . :. :...:. . :..
CCDS47 VDYCLGNHSISVHGLCLALSHN----CNCSGLQRYERNICEIDTEDCK--SASCKNGTTS
610 620 630 640 650
410 420 430 440 450
pF1KB4 VNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQ--------------FT
.. .: :. .: :. : .:: :..:: : ::.: :::.:. :. :.
CCDS47 THLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGFS
660 670 680 690 700 710
460 470 480 490 500 510
pF1KB4 CICMAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECAST
:.: :..: :: :::.: . : ....::: ...:.: : . :. :. . .:: .
CCDS47 CLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMN
720 730 740 750 760 770
520 530 540 550 560 570
pF1KB4 PCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHHGR-CVDGI--ASFSCACA
::.:.. :.: .:.:.:. :. : :......:. ::: .: : .. ..: : :
CCDS47 PCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCP
780 790 800 810 820 830
580 590 600 610 620
pF1KB4 PGYTGTRCESQVDECR--SQPCRHGGKCLDLVD-KYLCRCPSGTTGVNCEVNIDDCASNP
: ::: :... . : .:::... :: ::: . : : : :::... ::
CCDS47 PLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFLS
840 850 860 870 880 890
630 640 650 660 670 680
pF1KB4 CT-FGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGS
: .: :.: .: . :.:.:::.: ::..:::::.: :: ..:.::: : : : : :
CCDS47 CQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPEY
900 910 920 930 940 950
690 700 710 720 730 740
pF1KB4 LPPLCLPPSHPCAHEPC-SHGICYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAG
:.: . : :: .. : :. :.: ::..: : .: : : :.::
CCDS47 HGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINL--DECLSEPCLHD
960 970 980 990 1000 1010
750 760 770 780 790 800
pF1KB4 GTCSSDGMG-FHCTCPPGVQGRQCEL-LSPCTPNPCEHGGRCESAPGQLPVCSCPQGWQG
:.: ::.. . : : : : .:: . : ::: :: :: .. : ::: .
CCDS47 GVCI-DGINHYTCDCKSGFFGTHCETNANDCLSNPCLHG-RCTELINEYP-CSCDADGTS
1020 1030 1040 1050 1060 1070
810 820 830 840 850
pF1KB4 PRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDC-DPN----PCL
.:. ...:.. :: .:.: . : .:.: : :::: :...:..: .:. ::
CCDS47 TQCKIKINDCTS-IPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELNSVICL
1080 1090 1100 1110 1120 1130
860 870 880 890 900 910
pF1KB4 NGGSCQDGVG-SFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCTCPPGYG
::: : :: : .:.: :::::.: : ...:: :.:: :. : ::. ...: : ::..
CCDS47 NGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGYVCKCQPGWS
1140 1150 1160 1170 1180 1190
920 930 940 950 960 970
pF1KB4 GFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYT----GAHCQHEAD--PCLSRPC
: :::..: .: :.:: . :... . .::: ::. : : : ::.
CCDS47 GHHCENEL-ECIPNSCVHE-LCMENEPGSTCLCTPGFMTCSIGLLCGDEIRRITCLTPIF
1200 1210 1220 1230 1240 1250
980 990 1000 1010 1020 1030
pF1KB4 LHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAYCLCPPGWSGR
CCDS47 QRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGL
1260 1270 1280 1290 1300 1310
>>CCDS78156.1 EYS gene_id:346007|Hs108|chr6 (3165 aa)
initn: 968 init1: 968 opt: 1610 Z-score: 686.5 bits: 141.4 E(32554): 6.4e-32
Smith-Waterman score: 1849; 33.3% identity (57.7% similar) in 807 aa overlap (210-968:467-1247)
180 190 200 210 220 230
pF1KB4 SFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTCRQSGDLTYDCACLPGF---EGQNCEVN
: :...: .. . :: ::..:.
CCDS78 IPGCTKNPCWFLKNVYLIHQHLCYCGVTFHGICQDKGPAQFEYVWQLGFAGSEGEKCQGV
440 450 460 470 480 490
240 250 260 270 280 290
pF1KB4 VDD--CPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNT
.: . : . .: :. . : .: : . :... : :: .:..
CCDS78 IDAYFFLAANCTEDATYVNDPEDNNSSC---WFPHEGTKEI---------CANGCSCLSE
500 510 520 530 540
300 310 320 330 340 350
pF1KB4 LGG--HSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCACPMGKTGLLCHLD
. . .: :.:. .: : : : :.:.:.. :.: .. : :: ..
CCDS78 EDSQEYRYLCFLRWAGNMYLENTTDDQENECQHEAVCKDEINRPRCSCSLSYIGRLCVVN
550 560 570 580 590 600
360 370 380 390 400
pF1KB4 -DACVSNPC-HEDAICDTNPVNGRAICTCP--PGFTGGACDQDVDECSIGANPCEHLGRC
: :..: ..: . : :.: . . :. :...:. . :..
CCDS78 VDYCLGNHSISVHGLCLALSHN----CNCSGLQRYERNICEIDTEDCK--SASCKNGTTS
610 620 630 640 650
410 420 430 440 450
pF1KB4 VNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQ--------------FT
.. .: :. .: :. : .:: :..:: : ::.: :::.:. :. :.
CCDS78 THLRGYFFRKCVPGFKGTQCEIDIDECASHPCKNGATCIDQPGNYFCQCVPPFKVVDGFS
660 670 680 690 700 710
460 470 480 490 500 510
pF1KB4 CICMAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECAST
:.: :..: :: :::.: . : ....::: ...:.: : . :. :. . .:: .
CCDS78 CLCNPGYVGIRCEQDIDDCILNACEHNSTCKDLHLSYQCVCLSDWEGNFCEQESNECKMN
720 730 740 750 760 770
520 530 540 550 560 570
pF1KB4 PCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHHGR-CVDGI--ASFSCACA
::.:.. :.: .:.:.:. :. : :......:. ::: .: : .. ..: : :
CCDS78 PCKNNSTCTDLYKSYRCECTSGWTGQNCSEEINECDSDPCMNGGLCHESTIPGQFVCLCP
780 790 800 810 820 830
580 590 600 610 620
pF1KB4 PGYTGTRCESQVDECR--SQPCRHGGKCLDLVD-KYLCRCPSGTTGVNCEVNIDDCASNP
: ::: :... . : .:::... :: ::: . : : : :::... ::
CCDS78 PLYTGQFCHQRYNLCDLLHNPCRNNSTCLALVDANQHCICREEFEGKNCEIDVKDCLFLS
840 850 860 870 880 890
630 640 650 660 670 680
pF1KB4 CT-FGVCRDGINRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGS
: .: :.: .: . :.:.:::.: ::..:::::.: :: ..:.::: : : : : :
CCDS78 CQDYGDCEDMVNNFRCICRPGFSGSLCEIEINECSSEPCKNNGTCVDLTNRFFCNCEPEY
900 910 920 930 940 950
690 700 710 720 730 740
pF1KB4 LPPLCLPPSHPCAHEPC-SHGICYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAG
:.: . : :: .. : :. :.: ::..: : .: : : :.::
CCDS78 HGPFCELDVNKCKISPCLDEENCVYRTDGYNCLCAPGYTGINCEINL--DECLSEPCLHD
960 970 980 990 1000 1010
750 760 770 780 790 800
pF1KB4 GTCSSDGMG-FHCTCPPGVQGRQCEL-LSPCTPNPCEHGGRCESAPGQLPVCSCPQGWQG
:.: ::.. . : : : : .:: . : ::: :: :: .. : ::: .
CCDS78 GVCI-DGINHYTCDCKSGFFGTHCETNANDCLSNPCLHG-RCTELINEYP-CSCDADGTS
1020 1030 1040 1050 1060 1070
810 820 830 840 850
pF1KB4 PRCQQDVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDC-DPN----PCL
.:. ...:.. :: .:.: . : .:.: : :::: :...:..: .:. ::
CCDS78 TQCKIKINDCTS-IPCMNEGFCQKSAHGFTCICPRGYTGAYCEKSIDNCAEPELNSVICL
1080 1090 1100 1110 1120 1130
860 870 880 890 900 910
pF1KB4 NGGSCQDGVG-SFSCSCLPGFAGPRCARDVDECLSNPCGPGT-CTDHVASFTCTCPPGYG
::: : :: : .:.: :::::.: : ...:: :.:: :. : ::. ...: : ::..
CCDS78 NGGICVDGPGHTFDCRCLPGFSGQFCEININECSSSPCLHGADCEDHINGYVCKCQPGWS
1140 1150 1160 1170 1180 1190
920 930 940 950 960 970
pF1KB4 GFHCEQDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYT----GAHCQHEAD--PCLSRPC
: :::..: .: :.:: . :... . .::: ::. : : : ::.
CCDS78 GHHCENEL-ECIPNSCVHE-LCMENEPGSTCLCTPGFMTCSIGLLCGDEIRRITCLTPIF
1200 1210 1220 1230 1240 1250
980 990 1000 1010 1020 1030
pF1KB4 LHGGVCSAAHPGFRCTCLESFTGPQCQTLVDWCSRQPCQNGGRCVQTGAYCLCPPGWSGR
CCDS78 QRTDPISTQTYTIPPSETLVSSFPSIKATRIPAIMDTYPVDQGPKQTGIVKHDILPTTGL
1260 1270 1280 1290 1300 1310
>>CCDS32232.1 FBN1 gene_id:2200|Hs108|chr15 (2871 aa)
initn: 395 init1: 158 opt: 1497 Z-score: 640.0 bits: 132.7 E(32554): 2.5e-29
Smith-Waterman score: 2119; 29.2% identity (50.1% similar) in 1738 aa overlap (44-1500:977-2622)
20 30 40 50 60
pF1KB4 PMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGG-----RCTQLPSR---EAAC
.:. :. :. .: . : : :
CCDS32 GRICLDIRLETCFLRYEDEECTLPIAGRHRMDACCCSVGAAWGTEECEECPMRNTPEYEE
950 960 970 980 990 1000
70 80 90 100 110
pF1KB4 LCP--PGWVGERCQLEDP-------CHSGP--CAGRGVCQSSVVAGTARFSCRCPRGF--
::: ::.. .. : :. : :. .: :.... :. :.::: ::
CCDS32 LCPRGPGFATKEITNGKPFFKDINECKMIPSLCT-HGKCRNTI--GS--FKCRCDSGFAL
1010 1020 1030 1040 1050 1060
120 130 140 150 160
pF1KB4 --RGPDCSLPDPCLSSP--CAHGARCSVGPDGRFLCSCPPGYQG-----RSCRSDVDECR
. .:. : : :: :..: .: :. : : :.: ::.. ..: :.:::.
CCDS32 DSEERNCTDIDECRISPDLCGRG-QC-VNTPGDFECKCDEGYESGFMMMKNCM-DIDECQ
1070 1080 1090 1100 1110
170 180 190 200 210
pF1KB4 VGEP--CRHGGTCLNTPGSFRCQCPAGYT-GP---LCENPAVPCAPSP--CRNGGTCRQS
.: :: ::.: :: ::.::.:: :. .: : . : : : ::
CCDS32 R-DPLLCR-GGVCHNTEGSYRCECPPGHQLSPNISACID-INECELSAHLCPNGRCVNLI
1120 1130 1140 1150 1160 1170
220 230 240 250 260
pF1KB4 GDLTYDCACLPGFEGQN----CEVNVDDCPGHRCLNGGT---CVDGVNTYNCQCPPEWT-
: :.::: ::... : :..:.: .::: :... ..:.:.: : ..
CCDS32 GK--YQCACNPGYHSTPDRLFC-VDIDECS---IMNGGCETFCTNSEGSYECSCQPGFAL
1180 1190 1200 1210 1220
270 280 290 300 310
pF1KB4 --GQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTG----ESCSQNIDDC--A
: :.:::. .:: : .:: : : : . :.: .:. . ..: ....:
CCDS32 MPDQRSCTDIDECEDNPNIC-DGGQCTNIPGEYRCLCYDGFMASEDMKTCV-DVNECDLN
1230 1240 1250 1260 1270 1280
320 330 340 350 360 370
pF1KB4 TAVCFHGATCHDRVASFYCACPMGKTG----LLCHLDDACV--SNPCHEDAICDTNPVNG
.:. : ::.. .:: : : :: .: : . : .. : . :.: :: . :
CCDS32 PNICLSG-TCENTKGSFICHCDMGYSGKKGKTGCTDINECEIGAHNCGKHAVC-TN-TAG
1290 1300 1310 1320 1330 1340
380 390 400 410 420 430
pF1KB4 RAICTCPPGFTG-GACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGYTGP--RCET
:.: ::. : : :.:::: :.. : . . : ::.::. : : .:::: : :
CCDS32 SFKCSCSPGWIGDGIKCTDLDECSNGTHMCSQHADCKNTMGSYRCLCKEGYTGDGFTC-T
1350 1360 1370 1380 1390 1400
440 450 460 470 480
pF1KB4 DVNECLSGP--CRNQATCLDRIGQFTCICMAGFT----GTYCEVDIDECQSSP--CVNGG
:..:: . : : . ::. : . : : ::. : :: ::::: : : :: :
CCDS32 DLDECSENLNLCGN-GQCLNAPGGYRCECDMGFVPSADGKACE-DIDEC-SLPNICVFG-
1410 1420 1430 1440 1450
490 500 510 520 530
pF1KB4 VCKDRVNGFSCTCPSGF----SGSTCQLDVDECAS-TPCRNGAKCVDQPDGYECRCAEGF
.:.. . : : : :. ::..: ::.:: . : : .: .::. : .: : : :
CCDS32 TCHNLPGLFRCECEIGYELDRSGGNCT-DVNECLDPTTCISG-NCVNTPGSYICDCPPDF
1460 1470 1480 1490 1500 1510
540 550 560 570 580
pF1KB4 E----GTLC-DRNVDDCSPDPCHHGR-----CVD----GIASFSCACAPGYT-GTRCE--
: . : : .: : .: : . :... :: :. : . :: ::
CCDS32 ELNPTRVGCVDTRSGNCYLDIRPRGDNGDTACSNEIGVGVSKASCCCSLGKAWGTPCEMC
1520 1530 1540 1550 1560 1570
590 600 610
pF1KB4 ---------------------------SQVDECRSQP--CRHGGKCLDLVDKYLCRCPSG
..:::. : :. ::::.. .. ::::.:
CCDS32 PAVNTSEYKILCPGGEGFRPNPITVILEDIDECQELPGLCQ-GGKCINTFGSFQCRCPTG
1580 1590 1600 1610 1620 1630
620 630 640 650 660
pF1KB4 -----TTGVNCEVNIDDCAS-NPCTFGVCRDGINRYDCVCQPGFT----GPLC-NVEINE
: : :. ....: . . : :.: . .. : :.: : . : : ... .
CCDS32 YYLNEDTRV-CD-DVNECETPGICGPGTCYNTVGNYTCICPPDYMQVNGGNNCMDMRRSL
1640 1650 1660 1670 1680 1690
670 680 690
pF1KB4 CASSPCGEGGSCVDGENGFR-----CLC----------PPGSLP-P-------LC-----
: . ... .: ::: : : : : . : : ::
CCDS32 CYRNYYADNQTC-DGELLFNMTKKMCCCSYNIGRAWNKPCEQCPIPSTDEFATLCGSQRP
1700 1710 1720 1730 1740 1750
700 710 720 730
pF1KB4 ---------LPPS-HPCAHEP--CSHGICYDAPGGFRCVCEPGW-SGPRCSQSLARDACE
:: . : . : : .:.: . :.::: : :. . . : :.
CCDS32 GFVIDIYTGLPVDIDECREIPGVCENGVCINMVGSFRCECPVGFFYNDKLLVCEDIDECQ
1760 1770 1780 1790 1800 1810
740 750 760 770 780 790
pF1KB4 SQP-CRAGGTCSSDGMGFHCTCPPGVQGR---QCELLSPCT--PNPCEHGGRCESAPGQL
. : :. .. : . . ...: : :: . ::. . : :: : :: .: .. :..
CCDS32 NGPVCQRNAECINTAGSYRCDCKPGYRFTSTGQCNDRNECQEIPNICSHG-QCIDTVGSF
1820 1830 1840 1850 1860 1870
800 810 820 830 840
pF1KB4 PVCSCPQGWQGPRCQQ---DVDECAGPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQ--
: : :.. : :..:: : :: .: : : :::.: :. :. ..
CCDS32 -YCLCHTGFKTNDDQTMCLDINECERDA-CG-NGTCRNTIGSFNCRCNHGFILSHNNDCI
1880 1890 1900 1910 1920
850 860 870 880 890 900
pF1KB4 DINDC---DPNPCLNGGSCQDGVGSFSCSCLPGF-AGP--RCARDVDECLSNP--CGPGT
:...: . : : :: .: . ::::.:.: :. ..: : :..::: .: :.:::
CCDS32 DVDECASGNGNLCRNG-QCINTVGSFQCQCNEGYEVAPDGRTCVDINECLLEPRKCAPGT
1930 1940 1950 1960 1970 1980
910 920 930 940 950
pF1KB4 CTDHVASFTCTCPPGYG--GFHCEQDLPDC--SPSSCFNGGTCVDGVNSFSCLCRPGYT-
: . .:. : :::::. . .:: :. .: : : ::: . .::.::: :..
CCDS32 CQNLDGSYRCICPPGYSLQNEKCE-DIDECVEEPEIC-ALGTCSNTEGSFKCLCPEGFSL
1990 2000 2010 2020 2030 2040
960 970 980 990 1000
pF1KB4 ---GAHCQH-EADPCLSRPCLHGGVCSAA----HPGFRCTCLESFTGPQCQTLVDWCSRQ
: .:: . . : .. ..:: ::. : .: : . : : .
CCDS32 SSSGRRCQDLRMSYCYAK--FEGGKCSSPKSRNHSKQECCCALKGEG--------WGD--
2050 2060 2070 2080 2090
1010 1020 1030 1040 1050 1060
pF1KB4 PCQNGGRCVQTGAYCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSS
::. . . .:: : :: . : :. . . ..:. : ::.. :.:
CCDS32 PCELCPTEPDEAFRQICPYG-SGIIVG----PDDSAVDMDECKEPDVCKHG-QCINTDGS
2100 2110 2120 2130 2140
1070 1080 1090 1100 1110 1120
pF1KB4 HYCVCPEGR--TGSHCEQEVDPC-LAQPCQHGGTCRGYMGGYMCECLPGYNGD---NCED
. : :: : .:..: ..: : ...:: .: ::.. .::. : : :.. .:::
CCDS32 YRCECPFGYILAGNECV-DTDECSVGNPCGNG-TCKNVIGGFECTCEEGFEPGPMMTCED
2150 2160 2170 2180 2190 2200
1130 1140 1150 1160 1170
pF1KB4 DVDECASQPCQHGGSCIDLVARYLCSCPPGTL----GVLCEINEDDCGPGPPLDSGPRCL
..:::..: . :.. . : :.:: : . .:. .::.: : : . .
CCDS32 -INECAQNPLLCAFRCVNTYGSYECKCPVGYVLREDRRMCK-DEDECEEGKH-DCTEKQM
2210 2220 2230 2240 2250 2260
1180 1190 1200 1210 1220 1230
pF1KB4 HNGTCVDLVGGFRCTCPPGYT----GLRCEADINECRS--GACHAAHTRDCLQDPGGGFR
. : .:.: . : : ::: : : .: :::.. : :. .. :: . :..
CCDS32 E---CKNLIGTYMCICGPGYQRRPDGEGC-VDENECQTKPGICENGR---CL-NTRGSYT
2270 2280 2290 2300 2310
1240 1250 1260 1270 1280
pF1KB4 CLCHAGFSG-PRCQTVLSP----CESQPCQHGGQCRPSPGPGGGLTFT-CHCAQPF-WGP
: :. ::.. : . :. : .. :. .:. . . . .: . : : :::
CCDS32 CECNDGFTASPNQDECLDNREGYCFTEVLQN--MCQIGSSNRNPVTKSECCCDGGRGWGP
2320 2330 2340 2350 2360 2370
1290 1300 1310 1320
pF1KB4 RCE----RVARSCRELQCPVGV----------PCQ---QTPRGPRCACPPGLSGPSCRSF
.:: . . . ..: :: : :. .. :. .:. : :..
CCDS32 HCEICPFQGTVAFKKL-CPHGRGFMTNGADIDECKVIHDVCRNGECVNDRGSYHCICKT-
2380 2390 2400 2410 2420 2430
1330 1340 1350 1360 1370
pF1KB4 PGSPPGASNASC--------AAAPCLHGGSCRPAPLAPFFRCACAQGWT----GPRCEA-
: : ...:: : :: . :. . . ..:.: .:. : :.
CCDS32 -GYTPDITGTSCVDLNECNQAPKPC--NFICKNTEGS--YQCSCPKGYILQEDGRSCKDL
2440 2450 2460 2470 2480
1380 1390 1400 1410 1420
pF1KB4 -PAAAPEVSEEPRCPRA----ACQAKRG----DQRC--DRECNSPG--CGWDGGDCSLSV
:. . . . : . .:. : : . ::.: :: . : :. .
CCDS32 DECATKQHNCQFLCVNTIGGFTCKCPPGFTQHHTSCIDNNECTSDINLCG-SKGICQNTP
2490 2500 2510 2520 2530 2540
1430 1440 1450 1460 1470
pF1KB4 GDPWRQCEALQCWRLFNNSRCDPACSSPACLYDNFDCH------AGGRERTCNPVYEKYC
:. :: : : :. .. .: . : :. :: . .: : .
CCDS32 GS--FTCE---CQRGFSLDQTGSSCEDVDECEGNHRCQHGCQNIIGGYRCSCPQGYLQ--
2550 2560 2570 2580 2590
1480 1490 1500 1510 1520 1530
pF1KB4 ADHFADGRC-DQG-CNTEE-CGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADFL
:. ..: :.. : . . :: : .:
CCDS32 --HYQWNQCVDENECLSAHICG--GASCHNTLGSYKCMCPAGFQYEQFSGGCQDINECGS
2600 2610 2620 2630 2640 2650
>--
initn: 369 init1: 143 opt: 837 Z-score: 365.9 bits: 82.0 E(32554): 4.6e-14
Smith-Waterman score: 1261; 29.8% identity (49.0% similar) in 1046 aa overlap (60-1040:61-958)
30 40 50 60 70 80
pF1KB4 LLLLAGPGAAAPPCLDGSPCANGGRCTQLPSREAACLCPPGWV----GERCQLEDPCHSG
:: : : ::: :..: . ::
CCDS32 AGNVKETRASRAKRRGGGGHDALKGPNVCGSRYNA-YCCPGWKTLPGGNQCIVPICRHS-
40 50 60 70 80
90 100 110 120 130 140
pF1KB4 PCAGRGVCQSSVVAGTARFSCRCPRGFRGPDCSLPD--PCLSSPCAHGARCSVGPDGRFL
: : : :. . : :: : .:.:. . : . : .:. :: : .
CCDS32 -C-GDGFCSRPNM-------CTCPSGQIAPSCGSRSIQHC-NIRCMNGGSCS---DDH--
90 100 110 120 130
150 160 170 180 190 200
pF1KB4 CSCPPGYQGRSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPAGYTGPLCENP--AVPC
: : :: : : . : :. : : .:: :. .:. :: : :.::: :: . ::
CCDS32 CLCQKGYIGTHCGQPV--CESG--CLNGGRCV-APN--RCACTYGFTGPQCERDYRTGPC
140 150 160 170 180
210 220 230 240 250
pF1KB4 ----APSPCR---NGGTCRQSGDLTYDCACLPGFEGQNCEVNVDDCPG--HRCLNGGTCV
. . :. .: .: . : :: . :. ::. ::. : : : .
CCDS32 FTVISNQMCQGQLSGIVCTK----TLCCATVGRAWGHPCEM----CPAQPHPCRRG--FI
190 200 210 220 230
260 270 280 290 300 310
pF1KB4 DGVNTYNCQCPPEWTGQFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTGESCS
.. : :: :::::: :. :. ::.:.::.:. : : : . :
CCDS32 PNIRTGACQ------------DVDECQAIPGLCQ-GGNCINTVGSFECKCPAGHKLNEVS
240 250 260 270 280
320 330 340 350 360
pF1KB4 Q---NIDDCAT--AVCFHGATCHDRVASFYCACPMGKTGLLCHLDDA-CVSNPCHEDAIC
: .::.:.: ..: .:. : . :.:..: :: :. : . :.. . . :
CCDS32 QKCEDIDECSTIPGIC-EGGECTNTVSSYFCKCP---PGFYTSPDGTRCIDV---RPGYC
290 300 310 320 330
370 380 390 400 410 420
pF1KB4 DTNPVNGRAICTCPPGFTGGACDQDVDEC-SIGANPCEHLGRC-VNTQGSFLCQCGRGYT
: .::: : ..: : :. .: : :.. .. : . . .: :. ..
CCDS32 YTALTNGRCSNQLPQSITKMQCCCDAGRCWSPGVTVAPEM--CPIRATEDFNKLCSVPMV
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB4 GPRCETDVNECLSGPCRNQATCLDRIGQFTCICMAGFT-GTYCEVDIDECQSSPCVNGGV
: : . : : . :: : : . . .
CCDS32 IP-----------GRPEYPPPPLGPIPPVLPV-PPGFPPGPQIPVPRPPVEY---LYPSR
400 410 420 430
490 500 510 520 530 540
pF1KB4 CKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGTL--
:: . : . ::: . :.:: .:. : .:.:.: .::. :
CCDS32 EPPRVLPVNVT-------DYCQL-----VRYLCQNG-RCIPTPGSYRCECNKGFQLDLRG
440 450 460 470 480
550 560 570 580 590
pF1KB4 -CDRNVDDCSPDPCHHGRCVDGIASFSCACAPGY--TGTRCESQ-VDEC--RSQPCRHGG
: .::.: .:: :.:... .:..: : :: : :: : . .::: .. : ..:
CCDS32 ECI-DVDECEKNPCAGGECINNQGSYTCQCRAGYQSTLTRTECRDIDECLQNGRIC-NNG
490 500 510 520 530 540
600 610 620 630 640 650
pF1KB4 KCLDLVDKYLCRCPSG----TTGVNCEVNIDDCA-SNPCTFGVCRDGINRYDCVCQPGFT
.:.. .. : : .: : ::: ..:.:. : : :.: . . . :.:.:::
CCDS32 RCINTDGSFHCVCNAGFHVTRDGKNCE-DMDECSIRNMCLNGMCINEDGSFKCICKPGFQ
550 560 570 580 590 600
660 670 680 690 700
pF1KB4 ----GPLCNVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCSH
: :. .:::: . .: ::. ....:: : :: : .
CCDS32 LASDGRYCK-DINECETPGICMNGRCVNTDGSYRCECFPGLAVGL-------------DG
610 620 630 640
710 720 730 740 750 760
pF1KB4 GICYDAPGGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQG
.: :. .: .: :.. .: . : . .:. : :.: ..: :
CCDS32 RVCVDTH--MRSTCYGGYKRGQCIKPLFGAVTKSECC-----CASTEYAF---------G
650 660 670 680 690
770 780 790 800 810 820
pF1KB4 RQCELLSPC-TPNPCEHGGRCESAPGQLPVCSCPQGWQGPRCQQDVDECA-GPAPCGPHG
. :. :: . : :. . : :.::. . : :..::: : : :.:
CCDS32 EPCQ---PCPAQNSAEYQALCSSGPGMTSAGS------------DINECALDPDIC-PNG
700 710 720 730
830 840 850 860 870
pF1KB4 ICTNLAGSFSCTCHGGY----TGPSCDQDINDCDPNPCL-NGGSCQDGVGSFSCSCLPGF
:: :: :...: :..:: :: .: :::.: : : ..:.:.. ::: :.: ::
CCDS32 ICENLRGTYKCICNSGYEVDSTGKNC-VDINECVLNSLLCDNGQCRNTPGSFVCTCPKGF
740 750 760 770 780 790
880 890 900 910 920 930
pF1KB4 A-GP--RCARDVDECLSNPCGPGTCTDHVASFTCTCPPGYGGFHCEQDLPDCSPSSCFNG
: . .:.::: :.:: :.: . .:: : : :. : : . . :..
CCDS32 IYKPDLKTCEDIDECESSPCINGVCKNSPGSFICECSS-------ESTL-DPTKTICIET
800 810 820 830 840
940 950 960 970 980 990
pF1KB4 --GTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLHGGVCSAAHPGFRCTCLES-FT
::: . : .. :. . .:: . . : : :. :. . : : .
CCDS32 IKGTCWQTV--IDGRCEININGATLKSQC--CSSLGAAWGSPCTLCQVDPICGKGYSRIK
850 860 870 880 890 900
1000 1010 1020 1030 1040
pF1KB4 GPQCQTLVDWCSRQP--CQNGGRCVQT-GAY-CLCPPGWS----GRLC-DIRSLPCREAA
: ::. .: : : :.:: ::.: :.. : :: : . ::.: ::: :
CCDS32 GTQCED-IDECEVFPGVCKNG-LCVNTRGSFKCQCPSGMTLDATGRICLDIRLETCFLRY
910 920 930 940 950 960
1050 1060 1070 1080 1090 1100
pF1KB4 AQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCLAQPCQHGGTCRGYMG
CCDS32 EDEECTLPIAGRHRMDACCCSVGAAWGTEECEECPMRNTPEYEELCPRGPGFATKEITNG
970 980 990 1000 1010 1020
>>CCDS46562.1 SNED1 gene_id:25992|Hs108|chr2 (1413 aa)
initn: 1231 init1: 500 opt: 1300 Z-score: 561.3 bits: 117.1 E(32554): 6.1e-25
Smith-Waterman score: 1720; 36.9% identity (58.8% similar) in 650 aa overlap (123-733:272-906)
100 110 120 130 140
pF1KB4 CQSSVVAGTARFSCRCPRGFRGPDCSLPDPCLS-SPCAHGARC---SVGPDGRFLCSCPP
::. :: .:..: : . . :::
CCDS46 TTNVGVPGRWAFRIDDAQVRVGGCGHTTSVCLALRPCLNGGKCIDDCVTGNPSYTCSCLS
250 260 270 280 290 300
150 160 170 180 190 200
pF1KB4 GYQGRSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRN
:. :: :. ::.:: ...::..:::: . .:::::::::. :: ::. :: . :..
CCDS46 GFTGRRCHLDVNEC-ASQPCQNGGTCTHGINSFRCQCPAGFGGPTCETAQSPCDTKECQH
310 320 330 340 350 360
210 220 230 240 250 260
pF1KB4 GGTCRQSGDLTYDCACLPGFEGQNCEVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTG
:: : : . . :.: :. : ::..:::: :::::.::: :..:.: : . :
CCDS46 GGQC-QVENGSAVCVCQAGYTGAACEMDVDDCSPDPCLNGGSCVDLVGNYTCLCAEPFKG
370 380 390 400 410
270 280 290 300 310 320
pF1KB4 QFC-TED---VDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTGESCSQNI-DDCATAVC
: : : : : : ::::::: .. :. : : .:. : .: . . ::: :
CCDS46 LRCETGDHPVPDACLSAP--CHNGGTCVDADQGYVCECPEGFMGLDCRERVPDDCE---C
420 430 440 450 460 470
330 340 350 360 370
pF1KB4 FHGATCHDRVASFYCACPMGKTGLLCHLDDACVSNPCHEDAICDTNPV----NGRAICTC
.:. : . . : ::.: ::::... .. ::. .. : . .: .:.:
CCDS46 RNGGRCLG-ANTTLCQCPLGFFGLLCEFE--ITAMPCNMNTQCPDGGYCMEHGGSYLCVC
480 490 500 510 520 530
380 390 400 410 420 430
pF1KB4 PPGFTGGACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGYTGPRCE-TDVNECLSG
.: . . :. ..:: . : : . :. :.: ::. : .:: . . : ::
CCDS46 HTDH--NASHSLPSPCD--SDPCFNGGSCDAHDDSYTCECPRGFHGKHCEKARPHLCSSG
540 550 560 570 580
440 450 460 470 480 490
pF1KB4 PCRNQATCLDRIGQFTCICMAGFTGTYCEVDI-DECQSSPCVNGGVCKDRVNGFSCTCPS
:::: .:: . :.. : : ::: .::. : : :.:: :::.: .. ..: ::
CCDS46 PCRNGGTCKEAGGEYHCSCPYRFTGRHCEIGKPDSCASGPCHNGGTCFHYIGKYKCDCPP
590 600 610 620 630 640
500 510 520 530 540 550
pF1KB4 GFSGSTCQLDVDECASTPCRNGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPCHH-
:::: :.. . : .:: ::. : :. . :.: :. : :. .:: :. .:
CCDS46 GFSGRHCEIAPSPCFRSPCVNGGTCEDRDTDFFCHCQAGYMGRRCQAEVDCGPPEEVKHA
650 660 670 680 690 700
560 570 580 590
pF1KB4 -----GRCVDGIASFSC-------------ACAPGYTGT---RCESQVDECRSQPCRHGG
: . ..: ..: .: : . . .: ..:::::::: :::
CCDS46 TLRFNGTRLGAVALYACDRGYSLSAPSRIRVCQPHGVWSEPPQCL-EIDECRSQPCLHGG
710 720 730 740 750 760
600 610 620 630 640 650
pF1KB4 KCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPC-TFGVCRDGINRYDCVCQPGFTGPLC
.: : : ::: : .: :..::.. :.: ..:: . : ::. . : : : ::.: :
CCDS46 SCQDRVAGYLCLCSTGYEGAHCELERDECRAHPCRNGGSCRNLPGAYVCRCPAGFVGVHC
770 780 790 800 810 820
660 670 680 690 700 710
pF1KB4 NVEINECASSPCGEGGSCVDGENGFRCLCPPGSLPPLCLPPSHPCAHEPCS-HGICYDAP
..:.. : :::: .:: : .: ... :.:: . . : : :: ::. .: : .
CCDS46 ETEVDACDSSPCQHGGRCESGGGAYLCVCPESFFGYHCETVSDPCFSSPCGGRGYCLASN
830 840 850 860 870 880
720 730 740 750 760 770
pF1KB4 GGFRCVCEPGWSGPRCSQSLARDACESQPCRAGGTCSSDGMGFHCTCPPGVQGRQCELLS
:. :.:. :..: :.. :
CCDS46 GSHSCTCKVGYTGEDCAKELFPPTALKMERVEESGVSISWNPPNGPAARQMLDGYAVTYV
890 900 910 920 930 940
>>CCDS58052.1 CRB1 gene_id:23418|Hs108|chr1 (870 aa)
initn: 1336 init1: 568 opt: 1275 Z-score: 553.0 bits: 114.9 E(32554): 1.7e-24
Smith-Waterman score: 1537; 32.2% identity (54.7% similar) in 792 aa overlap (311-1002:27-802)
290 300 310 320 330 340
pF1KB4 QPNACHNGGTCFNTLGGHSCVCVNGWTGESCSQNIDDCATAVCFHGATCHDRVASFYCAC
:..: : . : ...::.: . :.:
CCDS58 MALKNINYLLIFYLSFSLLIYIKNSFCNKNNTRCLSNSCQNNSTCKDFSKDNDCSC
10 20 30 40 50
350 360 370 380 390
pF1KB4 PMGKTGLL--C-HLDDACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGACDQDVDECSI
..: : .. : : ::::. .: : ..: . .: ::::..: :. . :
CCDS58 SDTANNLDKDCDNMKDPCFSNPCQGSATCVNTPGERSFLCKCPPGYSGTICETTIGSC--
60 70 80 90 100 110
400 410 420 430 440 450
pF1KB4 GANPCEHLGRCVNTQGSFLCQCGRGYTGPRCETDVNECLSGPCRNQATCLDRIGQFTCIC
: : :.: : : . .: : ::.: :: : .:: :.::.: :.: : : ..:.:
CCDS58 GKNSCQHGGICHQDPIYPVCICPAGYAGRFCEIDHDECASSPCQNGAVCQDGIDGYSCFC
120 130 140 150 160 170
460 470 480 490 500 510
pF1KB4 MAGFTGTYCEVDIDECQSSPCVNGGVCKDRVNGFSCTCPSGFSGSTCQLDVDECASTPCR
. :. : .:....::: :.:: : ..: .... ..: :: ..:: .:.:..::: : ::
CCDS58 VPGYQGRHCDLEVDECASDPCKNEATCLNEIGRYTCICPHNYSGVNCELEIDECWSQPCL
180 190 200 210 220 230
520 530 540 550 560 570
pF1KB4 NGAKCVDQPDGYECRCAEGFEGTLCDRNVDDCSPDPC-HHGRCVDGIASFSCACA-PGYT
::: : : .: : :: :: : :. :.:.:. .:: : : :::: .:: :. :.:
CCDS58 NGATCQDALGAYFCDCAPGFLGDHCELNTDECASQPCLHGGLCVDGENRYSCNCTGSGFT
240 250 260 270 280 290
580 590 600 610 620 630
pF1KB4 GTRCESQVDECRSQPCRHGGKCLDLVDKYLCRCPSGTTGVNCEVNIDDCASNPC-TFGVC
::.::. . : :.::.... : : ::.: :.: : ::..::.....: :::: . : :
CCDS58 GTHCETLMPLCWSKPCHNNATCEDSVDNYTCHCWPGYTGAQCEIDLNECNSNPCQSNGEC
300 310 320 330 340 350
640 650 660 670
pF1KB4 RD-----------GI---------NRYDCVCQPGFTGPLCNVEINECASSPCGEGGSCVD
. :. . : :.::::::: :. ..:::.:.:: .::.: .
CCDS58 VELSSEKQYGRITGLPSSFSYHEASGYVCICQPGFTGIHCEEDVNECSSNPCQNGGTCEN
360 370 380 390 400 410
680 690 700 710 720
pF1KB4 GENGFRCLCPPGSLPPL------CLPPSHPCAHEPC-SHGICY----DAPGGFRCVCEPG
... : :: .: : :.:. : ..: : :. :: :.: :
CCDS58 LPGNYTCHCPFDNLSRTFYGGRDCSDILLGCTHQQCLNNGTCIPHFQDGQHGFSCLCPSG
420 430 440 450 460 470
730 740 750 760
pF1KB4 WSGPRC----SQSLARDA---CESQPCRAGGTCSSDGMGFHCTCPPGV------------
..: : . :. :. .: . :. . .. :. . : ..
CCDS58 YTGSLCEIATTLSFEGDGFLWVKSGSVTTKGSVCNIALRFQTVQPMALLLFRSNRDVFVK
480 490 500 510 520 530
770 780 790 800
pF1KB4 ----------------QGRQCELLSPCTPNPCEHGGRC---ESAPGQLPVCSCPQG--WQ
:.. ..: : . : . :.. : :: . .
CCDS58 LELLSGYIHLSIQVNNQSKVLLFISHNTSDGEWHFVEVIFAEAVTLTLIDDSCKEKCIAK
540 550 560 570 580 590
810 820 830 840 850
pF1KB4 GPR-CQQDVDECA------GPAPCGPHGICTNLAGSFSCTCHGGYTGPSCDQDINDCDPN
.: ..: . :: : : : . . : . .. ...: : :::. : :
CCDS58 APTPLESDQSICAFQNSFLGGLPVGMTSNGVALLNFYNMPSTPSFVG--CLQDIK-IDWN
600 610 620 630 640 650
860 870 880 890 900 910
pF1KB4 P-CLNGGSCQDGVGSFSCSCLPGFAGPRCARDVDECLSNPCGP-GTCTDHVASFTCTCPP
:.. : : : : :: :.: : : :.:: : : . :. : :
CCDS58 HITLENIS--------SGSSLNVKAG--CVRK-DWCESQPCQSRGRCINLWLSYQCDCHR
660 670 680 690 700
920 930 940 950 960
pF1KB4 GYGGFHC-------EQDLPD--CSPS----SCFNGGTCVDGVNSFSCLCRPGYTGAHCQH
: : .: .. ::. :. .:.:::.:.. . ..:.::::.:: :..
CCDS58 PYEGPNCLRGKFCRQSRLPSTVCGNEKTNLTCYNGGNCTEFQTELKCMCRPGFTGEWCEK
710 720 730 740 750 760
970 980 990 1000 1010 1020
pF1KB4 EADPCLSRPCLHGGVCSAAHPGFRCTCLESFTGPQCQT-LVDWCSRQPCQNGGRCVQTGA
. : : : ::..::.:. :.: : .:.: .:.. :.:
CCDS58 DIDECASDPCVNGGLCQDLLNKFQCLCDVAFAGERCEVDLADDLISDIFTTIGSVTVALL
770 780 790 800 810 820
1030 1040 1050 1060 1070 1080
pF1KB4 YCLCPPGWSGRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSH
CCDS58 LILLLAIVASVVTSNKRATQGTYSPSRQEKEGSRVEMWNLMPPPAMERLI
830 840 850 860 870
>>CCDS34222.1 FBN2 gene_id:2201|Hs108|chr5 (2912 aa)
initn: 487 init1: 151 opt: 1255 Z-score: 539.5 bits: 114.1 E(32554): 1e-23
Smith-Waterman score: 2189; 29.7% identity (50.4% similar) in 1794 aa overlap (44-1495:1022-2717)
20 30 40 50 60
pF1KB4 PMSPPPPPPPVRALPLLLLLAGPGAAAPPCLDGSPCANGG----RCTQLP---SREAACL
.:. :: :. .: . : ..: :
CCDS34 GRVCLDIRMEQCYLKWDEDECIHPVPGKFRMDACCCAVGAAWGTECEECPKPGTKEYETL
1000 1010 1020 1030 1040 1050
70 80 90 100 110
pF1KB4 CPPGW----VGE----RCQLED--PCHSGP--CAGRGVCQSSVVAGTARFSCRCPRGF--
:: : :. : .: :.. : :. : :.... :. :.::: ::
CCDS34 CPRGAGFANRGDVLTGRPFYKDINECKAFPGMCT-YGKCRNTI--GS--FKCRCNSGFAL
1060 1070 1080 1090 1100
120 130 140 150 160
pF1KB4 --RGPDCSLPDPCLSSPCAHGARCSVGPDGRFLCSCPPGYQG-----RSCRSDVDEC-RV
. .:. : : :: :. :. : : : : ::.. ..: :.::: :
CCDS34 DMEERNCTDIDECRISPDLCGSGICVNTPGSFECECFEGYESGFMMMKNCM-DIDECERN
1110 1120 1130 1140 1150 1160
170 180 190 200 210
pF1KB4 GEPCRHGGTCLNTPGSFRCQCPAGYT-GPLCEN--PAVPCAPSP--CRNGGTCRQSGDLT
:: ::::.:: :::.:.:: :. .: :. :. : :::: . : :
CCDS34 PLLCR-GGTCVNTEGSFQCDCPLGHELSPSREDCVDINECSLSDNLCRNGKCVNMIG--T
1170 1180 1190 1200 1210 1220
220 230 240 250 260
pF1KB4 YDCACLPGFEG----QNCEVNVDDCPGHRCLNGGT---CVDGVNTYNCQCPPEWT----G
:.:.: ::... :.: ...:.: .::: :... ..:.:.: .. :
CCDS34 YQCSCNPGYQATPDRQGC-TDIDEC---MIMNGGCDTQCTNSEGSYECSCSEGYALMPDG
1230 1240 1250 1260 1270
270 280 290 300 310 320
pF1KB4 QFCTEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTG----ESCSQNIDDC--ATAV
. :. :.:::. .:. : .:: : : : . :.: .:. . ..: ....: . .
CCDS34 RSCA-DIDECENNPDIC-DGGQCTNIPGEYRCLCYDGFMASMDMKTCI-DVNECDLNSNI
1280 1290 1300 1310 1320 1330
330 340 350 360 370
pF1KB4 CFHGATCHDRVASFYCACPMG---KTGLL-CHLDDACV--SNPCHEDAICDTNPVNGRAI
:. : :.. .:: : : .: : : : : : .. : : : . : :
CCDS34 CMFGE-CENTKGSFICHCQLGYSVKKGTTGCTDVDECEIGAHNCDMHASCLNIP--GSFK
1340 1350 1360 1370 1380 1390
380 390 400 410 420 430
pF1KB4 CTCPPGFTG-GACDQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGYTGP--RCETDVN
:.: :. : : :.:::: :.. : ..:::: ::. : :..:.:: : .::.
CCDS34 CSCREGWIGNGIKCIDLDECSNGTHQCSINAQCVNTPGSYRCACSEGFTGDGFTC-SDVD
1400 1410 1420 1430 1440 1450
440 450 460 470 480
pF1KB4 ECLSGP--CRNQATCLDRIGQFTCICMAGFT----GTYCEVDIDECQ-SSPCVNGGVCKD
:: . :.: . ::. : . : : ::: . :. :::::. .. :: : .:..
CCDS34 ECAENINLCEN-GQCLNVPGAYRCECEMGFTPASDSRSCQ-DIDECSFQNICVFG-TCNN
1460 1470 1480 1490 1500
490 500 510 520 530
pF1KB4 RVNGFSCTCPSGF----SGSTCQLDVDECAST-PCRNGAKCVDQPDGYECRCAEGFE---
. : : : .:. .:..: :.::::. : :: ::. : ::: : :.
CCDS34 LPGMFHCICDDGYELDRTGGNCT-DIDECADPINCVNGL-CVNTPGRYECNCPPDFQLNP
1510 1520 1530 1540 1550 1560
540 550 560 570 580
pF1KB4 -GTLC-DRNVDDC--SPDPCHHGR--CVD----GIASFSCACAPGYT-GTRCES------
:. : : : .: . : : : :.. :: :. : . :. ::.
CCDS34 TGVGCVDNRVGNCYLKFGPRGDGSLSCNTEIGVGVSRSSCCCSLGKAWGNPCETCPPVNS
1570 1580 1590 1600 1610 1620
590 600 610
pF1KB4 -----------------------QVDECRSQP--CRHGGKCLDLVDKYLCRCPSG-----
..:::. : :. ::.:.. .. :.::.:
CCDS34 TEYYTLCPGGEGFRPNPITIILEDIDECQELPGLCQ-GGNCINTFGSFQCECPQGYYLSE
1630 1640 1650 1660 1670 1680
620 630 640 650 660
pF1KB4 TTGVNCEVNIDDCASNP--CTFGVCRDGINRYDCVCQPGFT----GPLC-NVEINECASS
: . :: .::.: ..: : :.: . .. : :.: : . : : ... . : :
CCDS34 DTRI-CE-DIDECFAHPGVCGPGTCYNTLGNYTCICPPEYMQVNGGHNCMDMRKSFCYRS
1690 1700 1710 1720 1730 1740
670 680 690 700 710
pF1KB4 PCGEGGSCVDGENGFR-----CLCPPGSLPPLCLPPSHPCAHEPCSHGICYDAPG--GFR
.: .: ..: : : : . ..:: ::: .:: :.
CCDS34 --YNGTTC-ENELPFNVTKRMCCCTYNVGKAW----NKPC--EPCP------TPGTADFK
1750 1760 1770 1780
720 730 740 750 760
pF1KB4 CVCE--PGWS-GPRCSQSLARDACESQP--CRAGGTCSSDGMGFHCTCPPGVQGRQ----
.: ::.. . .... : :. : : :.:.: .. .:.: :: : . .
CCDS34 TICGNIPGFTFDIHTGKAVDIDECKEIPGIC-ANGVCINQIGSFRCECPTGFSYNDLLLV
1790 1800 1810 1820 1830 1840
770 780 790 800 810 820
pF1KB4 CELLSPCT--PNPCEHGGRCESAPGQLPVCSCPQGWQ-GPR--CQQDVDECAG-PAPCGP
:: .. :. : :.... : ..::. : : :.. .: : : .:: : :.
CCDS34 CEDIDECSNGDNLCQRNADCINSPGSYR-CECAAGFKLSPNGACV-DRNECLEIPNVCS-
1850 1860 1870 1880 1890 1900
830 840 850 860 870
pF1KB4 HGICTNLAGSFSCTCHGGYTGPSCDQ----DINDCDPNPCLNGGSCQDGVGSFSCSCLPG
::.:..: ::..: ::.:. . : :: :...:. .:: :: .:.. :::..: : ::
CCDS34 HGLCVDLQGSYQCICHNGFKA-SQDQTMCMDVDECERHPCGNG-TCKNTVGSYNCLCYPG
1910 1920 1930 1940 1950 1960
880 890 900 910 920
pF1KB4 FA---GPRCARDVDECLS---NPCGPGTCTDHVASFTCTCPPGY----GGFHCEQDLPDC
: . : :.::: : . : : : ....:: : : :: : .: : .:
CCDS34 FELTHNNDCL-DIDECSSFFGQVCRNGRCFNEIGSFKCLCNEGYELTPDGKNC-IDTNEC
1970 1980 1990 2000 2010 2020
930 940 950 960 970 980
pF1KB4 S--PSSCFNGGTCVDGVNSFSCLCRPGYT--GAHCQHEADPCLSRP--CLHGGVCSAAHP
:.:: . ::: . .:: :.: ::: . .: . . : : :: :. :. .
CCDS34 VALPGSC-SPGTCQNLEGSFRCICPPGYEVKSENCI-DINECDEDPNICLFGS-CTNTPG
2030 2040 2050 2060 2070
990 1000 1010 1020
pF1KB4 GFRCTCLESFT----GPQC-QTLVDWCSRQPCQNGGRCV------QTGAYCLCP--PG--
::.: : .:. : .: .: ..: . .:: .: : : : : ::
CCDS34 GFQCLCPPGFVLSDNGRRCFDTRQSFCFTN-FENG-KCSVPKAFNTTKAKCCCSKMPGEG
2080 2090 2100 2110 2120 2130
1030 1040 1050 1060
pF1KB4 WSG--RLC---------DI-----RSLPC-REAAAQIGVRLEQ--LCQAGGQCVDEDSSH
:. .:: :. ..: ... ... ::. .: ..:::.. :.:
CCDS34 WGDPCELCPKDDEVAFQDLCPYGHGTVPSLHDTREDVNECLESPGIC-SNGQCINTDGSF
2140 2150 2160 2170 2180 2190
1070 1080 1090 1100 1110 1120
pF1KB4 YCVCPEGR----TGSHCEQEVDPC-LAQPCQHGGTCRGYMGGYMCECLPGYNGD---NCE
: :: : :: .: ..: : ...:: .: :: . .:.. :.: :.. :::
CCDS34 RCECPMGYNLDYTGVRCV-DTDECSIGNPCGNG-TCTNVIGSFECNCNEGFEPGPMMNCE
2200 2210 2220 2230 2240 2250
1130 1140 1150 1160 1170
pF1KB4 DDVDECASQPCQHGGSCIDLVARYLCSCPPGTL----GVLCEINEDDCGPGPPLDSGPRC
: ..:::..: . :.. . : :.:: : .:. . :.:. : : . :
CCDS34 D-INECAQNPLLCAFRCMNTFGSYECTCPIGYALREDQKMCK-DLDECAEG--LHD---C
2260 2270 2280 2290 2300
1180 1190 1200 1210 1220
pF1KB4 LHNGT-CVDLVGGFRCTCPPGYT----GLRCEADINECRS--GACHAAHTRDCLQDPGGG
: : .:.: : : ::::.. : : .: ::::. : :. .. :. . :.
CCDS34 ESRGMMCKNLIGTFMCICPPGMARRPDGEGC-VDENECRTKPGICENGR---CV-NIIGS
2310 2320 2330 2340 2350 2360
1230 1240 1250
pF1KB4 FRCLCHAGF----SGPRC----------QTVLSPCE-----------SQPCQHGG-----
.:: :. :: :: .: ... . :. :. : ::
CCDS34 YRCECNEGFQSSSSGTECLDNRQGLCFAEVLQTICQMASSSRNLVTKSECCCDGGRGWGH
2370 2380 2390 2400 2410 2420
1260 1270 1280
pF1KB4 QCR--PSPG--------PGG-GLTFT------C----------HCAQPFWGPRC------
::. : :: : : : : : .: . . . ::
CCDS34 QCELCPLPGTAQYKKICPHGPGYTTDGRDIDECKVMPNLCTNGQCINTMGSFRCFCKVGY
2430 2440 2450 2460 2470 2480
1290 1300 1310 1320
pF1KB4 --ERVARSCREL-QC-----PVGVPCQQTPRGPRCACPPGL----SGPSCRSFP------
. . :: .: .: : . :..: . .:.:: : .: .:...
CCDS34 TTDISGTSCIDLDECSQSPKPCNYICKNTEGSYQCSCPRGYVLQEDGKTCKDLDECQTKQ
2490 2500 2510 2520 2530 2540
1330 1340 1350 1360
pF1KB4 -----------GS-----PPGAS--------NASCAAAPCLHG--GSCRPAPLAPFFRCA
:. ::: . : :.. : : : : :. .: . : :
CCDS34 HNCQFLCVNTLGGFTCKCPPGFTQHHTACIDNNECGSQPSLCGAKGICQNTPGS--FSCE
2550 2560 2570 2580 2590
1370 1380 1390 1400 1410
pF1KB4 CAQGW----TGPRCEAPAAAPEVSEEPRCPRAACQAKRGDQRCDRECNS---PGCGW---
: .:. :: :: . : . . :: .. :: : :: : . :
CCDS34 CQRGFSLDATGLNCED---VDECDGNHRCQHG-CQNILGGYRCG--CPQGYIQHYQWNQC
2600 2610 2620 2630 2640 2650
1420 1430 1440 1450 1460 1470
pF1KB4 -DGGDCSLSVGDPWRQCEALQCWRLFNNSRCDPACSSPACLYDNFDCHAGGRERTCNPVY
: ..:: .: : . .:. ... .: :: : . .:.:. .:. :
CCDS34 VDENECS----NP-NACGSASCYNTLGSYKC--ACPS-GFSFDQFSS-------ACHDVN
2660 2670 2680 2690
1480 1490 1500 1510 1520 1530
pF1KB4 EKYCADHFADGRCDQGCNTEECGWDGLDCASEVPALLARGVLVLTVLLPPEELLRSSADF
: :.. . . :. ::.. : :.
CCDS34 E--CSS--SKNPCNYGCSNTEGGYLCGCPPGYYRVGQGHCVSGMGFNKGQYLSLDTEVDE
2700 2710 2720 2730 2740 2750
>--
initn: 350 init1: 142 opt: 1040 Z-score: 450.2 bits: 97.6 E(32554): 9.4e-19
Smith-Waterman score: 1301; 29.8% identity (51.9% similar) in 978 aa overlap (183-1077:97-987)
160 170 180 190 200 210
pF1KB4 RSCRSDVDECRVGEPCRHGGTCLNTPGSFRCQCPAGYTGPLCENPAVPCAPSPCRNGGTC
: ::. : : .. :: . : .:
CCDS34 GAAVASRVRRRGQQDVLRGPNVCGSRFHSYC-CPGWKTLPGGNQCIVPICRNSCGDGFCS
70 80 90 100 110 120
220 230 240 250 260 270
pF1KB4 RQSGDLTYDCACLPGFEGQNC-EVNVDDCPGHRCLNGGTCVDGVNTYNCQCPPEWTGQFC
: . :.: : ...: ....: . ::.:::::.: .::: . : .:
CCDS34 RPNM-----CTCSSGQISSTCGSKSIQQC-SVRCMNGGTCADD----HCQCQKGYIGTYC
130 140 150 160 170
280 290 300 310 320
pF1KB4 TEDVDECQLQPNACHNGGTCFNTLGGHSCVCVNGWTGESCSQNIDDCATAVCF---HGAT
. : :. :.:.::: : .: . :.:: :.:: .: . : :. :: ..
CCDS34 GQPV--CE---NGCQNGGRC---IGPNRCACVYGFTGPQCER---DYRTGPCFTQVNNQM
180 190 200 210 220
330 340 350 360 370 380
pF1KB4 CHDRVASFYCACPMGKTGLLCHLDDACVSNPCHEDAICDTNPVNGRAICTCPPGFTGGAC
:. ..... :. :: : : ..::. .: ..: : :.. :::
CCDS34 CQGQLTGIVCT----KT-LCCATIGRAWGHPCE---MCPAQPQPCRR--GFIPNIRTGAC
230 240 250 260 270
390 400 410 420 430 440
pF1KB4 DQDVDECSIGANPCEHLGRCVNTQGSFLCQCGRGY----TGPRCETDVNEC--LSGPCRN
::::::. . :. : :.:: ::: :.: :. : .:: :..:: . : :..
CCDS34 -QDVDECQAIPGICQG-GNCINTVGSFECRCPAGHKQSETTQKCE-DIDECSIIPGICET
280 290 300 310 320 330
450 460 470 480 490
pF1KB4 QATCLDRIGQFTCICMAGFT----GTYCEVDIDECQSSPCVNG---GVCKDRVNG----F
. : . .:.. :.: :.. :. : ::. ... : .: : : ... : .
CCDS34 -GECSNTVGSYFCVCPRGYVTSTDGSRC---IDQ-RTGMCFSGLVNGRCAQELPGRMTKM
340 350 360 370 380
500 510 520 530 540
pF1KB4 SCTCPSGFS---GS---TCQLDVDECASTPCRNGAKCVDQPDGYECR-CAEGFEGTLCDR
.: : : :. .: . .: : .: : . : . : .: .
CCDS34 QCCCEPGRCWGIGTIPEACPVRGSEEYRRLCMDGLPMGGIPGSAGSRPGGTGGNGFAPSG
390 400 410 420 430 440
550 560 570 580 590
pF1KB4 NVDDCSPD-------PCHHGRC--VDGIASFSCACAPGYTGTRCESQ-VDECRSQP--CR
: . .: : .: : : . . . .: :: .: .: :. . :
CCDS34 NGNGYGPGGTGFIPIPGGNGFSPGVGGAGVGAGGQGPIITGLTILNQTIDICKHHANLCL
450 460 470 480 490 500
600 610 620 630 640
pF1KB4 HGGKCLDLVDKYLCRCPSG---TTGVNCEVNIDDCASNPCTFGVCRDGINRYDCVCQPGF
.: .:. :..: :.: : .. .: ...:.:.::::: : : . . : : :. ::
CCDS34 NG-RCIPTVSSYRCECNMGYKQDANGDC-IDVDECTSNPCTNGDCVNTPGSYYCKCHAGF
510 520 530 540 550 560
650 660 670 680 690
pF1KB4 ----TGPLCNVEINECASSP--CGEGGSCVDGENGFRCLCPPG----SLPPLCLPPSHPC
: : ..:.:: .. : ..: ::. ...:.:.: : . :. ..
CCDS34 QRTPTKQAC-IDIDECIQNGVLC-KNGRCVNTDGSFQCICNAGFELTTDGKNCVDHDECT
570 580 590 600 610 620
700 710 720 730 740 750
pF1KB4 AHEPCSHGICYDAPGGFRCVCEPGW----SGPRCSQSLARDACESQP-CRAGGTCSSDGM
. . : .:.: . :.:.:.:.::. .: :.. : :.. : : .:.:
CCDS34 TTNMCLNGMCINEDGSFKCICKPGFVLAPNGRYCTDV---DECQTPGICMNGHCINSEG-
630 640 650 660 670
760 770 780 790 800
pF1KB4 GFHCTCPPGV----QGRQCELLSPCTPNPCEHG---GRC-ESAPGQLPVCSCPQGWQGPR
.:.: ::::. .:: : .. . : : : : . :: . :
CCDS34 SFRCDCPPGLAVGMDGRVC--VDTHMRSTCYGGIKKGVCVRPFPGAVTKSEC--------
680 690 700 710 720
810 820 830 840 850 860
pF1KB4 CQQDVDECAGPAPCGPHGIC-TNLAGSFSCTCHGGYTGPSCD-QDINDC--DPNPCLNGG
: . : : :: : : .. .. : : .: .: . : .:::.: ::. : ::
CCDS34 CCANPDYGFGE-PCQP---CPAKNSAEFHGLCSSG-VGITVDGRDINECALDPDICANG-
730 740 750 760 770 780
870 880 890 900 910
pF1KB4 SCQDGVGSFSCSCLPGF---AGPRCARDVDECLSNP--CGPGTCTDHVASFTCTCPPGYG
:.. ::. :.: :. :. : :.:::: : : : : . .:..:::::::
CCDS34 ICENLRGSYRCNCNSGYEPDASGRNCIDIDECLVNRLLCDNGLCRNTPGSYSCTCPPGYV
790 800 810 820 830 840
920 930 940 950 960 970
pF1KB4 GFHCE----QDLPDCSPSSCFNGGTCVDGVNSFSCLCRPGYTGAHCQHEADPCLSRPCLH
:. : .:. .: . : ::. : ....::.: : :: .. . . :.. :.
CCDS34 -FRTETETCEDINECESNPCVNGA-CRNNLGSFNCECSPG---SKLSSTGLICIDS--LK
850 860 870 880 890
980 990 1000 1010 1020
pF1KB4 GGVCSAAHPGFRCTCL---ESFTGPQCQTL-VDWCSRQPCQNGGRCVQTGAYCLCPPGWS
: .: :: .. . : :: . : : ::. :: : :: :
CCDS34 G-TCWLNIQDSRCEVNINGATLKSECCATLGAAWGS--PCE---RCELDTA---CPRG--
900 910 920 930 940
1030 1040 1050 1060 1070 1080
pF1KB4 GRLCDIRSLPCREAAAQIGVRLEQLCQAGGQCVDEDSSHYCVCPEGRTGSHCEQEVDPCL
: :... : : . . : . .: .:.::. .: .: :::: :
CCDS34 --LARIKGVTC-EDVNECEV-FPGVCP-NGRCVNSKGSFHCECPEGLTLDGTGRVCLDIR
950 960 970 980 990
1090 1100 1110 1120 1130 1140
pF1KB4 AQPCQHGGTCRGYMGGYMCECLPGYNGDNCEDDVDECASQPCQHGGSCIDLVARYLCSCP
CCDS34 MEQCYLKWDEDECIHPVPGKFRMDACCCAVGAAWGTECEECPKPGTKEYETLCPRGAGFA
1000 1010 1020 1030 1040 1050
2321 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 19:45:33 2016 done: Sat Nov 5 19:45:35 2016
Total Scan time: 8.180 Total Display time: 1.610
Function used was FASTA [36.3.4 Apr, 2011]