FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4590, 1094 aa
1>>>pF1KE4590 1094 - 1094 aa - 1094 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.5129+/-0.00162; mu= -1.9111+/- 0.098
mean_var=316.8804+/-64.296, 0's: 0 Z-trim(106.8): 64 B-trim: 254 in 1/51
Lambda= 0.072049
statistics sampled from 9152 (9191) to 9152 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.282), width: 16
Scan time: 4.590
The best scores are: opt bits E(32554)
CCDS4041.1 AP3B1 gene_id:8546|Hs108|chr5 (1094) 6942 737.0 5.5e-212
CCDS64186.1 AP3B1 gene_id:8546|Hs108|chr5 (1045) 6629 704.4 3.3e-202
CCDS61737.1 AP3B2 gene_id:8120|Hs108|chr15 (1101) 2944 321.4 6.9e-87
CCDS61736.1 AP3B2 gene_id:8120|Hs108|chr15 (1050) 2189 242.9 2.8e-63
CCDS45331.1 AP3B2 gene_id:8120|Hs108|chr15 (1082) 2189 242.9 2.9e-63
CCDS54515.1 AP1B1 gene_id:162|Hs108|chr22 ( 919) 535 70.9 1.4e-11
CCDS13856.2 AP1B1 gene_id:162|Hs108|chr22 ( 939) 535 71.0 1.5e-11
CCDS13855.1 AP1B1 gene_id:162|Hs108|chr22 ( 949) 535 71.0 1.5e-11
CCDS32622.1 AP2B1 gene_id:163|Hs108|chr17 ( 937) 528 70.2 2.4e-11
CCDS32621.1 AP2B1 gene_id:163|Hs108|chr17 ( 951) 528 70.2 2.4e-11
>>CCDS4041.1 AP3B1 gene_id:8546|Hs108|chr5 (1094 aa)
initn: 6942 init1: 6942 opt: 6942 Z-score: 3919.4 bits: 737.0 E(32554): 5.5e-212
Smith-Waterman score: 6942; 99.9% identity (99.9% similar) in 1094 aa overlap (1-1094:1-1094)
10 20 30 40 50 60
pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 QVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 IRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 IRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 SIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 SIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 AAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 AAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEII
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 KHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 KHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 AKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGALSKYAKKIFLA
:::::::::::::::::::::::::::::::::::::::::::: :::::::::::::::
CCDS40 AKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNVKSGALSKYAKKIFLA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 QKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 QKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEW
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE4 TPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 TPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE4 SSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 SSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE4 DSESESEPESESESRRVTKEKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 DSESESEPESESESRRVTKEKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE4 SLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 SLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMV
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE4 SIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 SIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTA
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE4 SFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 SFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE4 VIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 VIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIG
1030 1040 1050 1060 1070 1080
1090
pF1KE4 SVLLRELKPVLSQG
::::::::::::::
CCDS40 SVLLRELKPVLSQG
1090
>>CCDS64186.1 AP3B1 gene_id:8546|Hs108|chr5 (1045 aa)
initn: 6629 init1: 6629 opt: 6629 Z-score: 3743.8 bits: 704.4 E(32554): 3.3e-202
Smith-Waterman score: 6629; 99.9% identity (99.9% similar) in 1045 aa overlap (50-1094:1-1045)
20 30 40 50 60 70
pF1KE4 LGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKLDAMKRIVGMIAKGKNASEL
::::::::::::::::::::::::::::::
CCDS64 MLESNKDSAKLDAMKRIVGMIAKGKNASEL
10 20 30
80 90 100 110 120 130
pF1KE4 FPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRALKDPNQLIRASALRVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 FPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRALKDPNQLIRASALRVL
40 50 60 70 80 90
140 150 160 170 180 190
pF1KE4 SSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQKEMLIEVIEKLLKDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 SSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQKEMLIEVIEKLLKDK
100 110 120 130 140 150
200 210 220 230 240 250
pF1KE4 STLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWGQVVIIHMLTRYARTQFVSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 STLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWGQVVIIHMLTRYARTQFVSP
160 170 180 190 200 210
260 270 280 290 300 310
pF1KE4 WKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLLIRNTKPLLQSRNAAVVMAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 WKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLLIRNTKPLLQSRNAAVVMAV
220 230 240 250 260 270
320 330 340 350 360 370
pF1KE4 AQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATMSIQRKGMFEPYLKSFYVRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 AQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATMSIQRKGMFEPYLKSFYVRS
280 290 300 310 320 330
380 390 400 410 420 430
pF1KE4 TDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQFAAATIQTIGRCATNILEVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 TDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQFAAATIQTIGRCATNILEVT
340 350 360 370 380 390
440 450 460 470 480 490
pF1KE4 DTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEIIKHMAKLLDSITVPVARASI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 DTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEIIKHMAKLLDSITVPVARASI
400 410 420 430 440 450
500 510 520 530 540 550
pF1KE4 LWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLGAKLYLTNSKQTKLLTQYIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 LWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLGAKLYLTNSKQTKLLTQYIL
460 470 480 490 500 510
560 570 580 590 600 610
pF1KE4 NLGKYDQNYDIRDRTRFIRQLIVPNEKSGALSKYAKKIFLAQKPAPLLESPFKDRDHFQL
::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::
CCDS64 NLGKYDQNYDIRDRTRFIRQLIVPNVKSGALSKYAKKIFLAQKPAPLLESPFKDRDHFQL
520 530 540 550 560 570
620 630 640 650 660 670
pF1KE4 GTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEWTPAGKAKQENSAKKFYSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 GTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEWTPAGKAKQENSAKKFYSES
580 590 600 610 620 630
680 690 700 710 720 730
pF1KE4 EEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDSSSEQDSESGRESGLENKRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 EEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDSSSEQDSESGRESGLENKRT
640 650 660 670 680 690
740 750 760 770 780 790
pF1KE4 AKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSSDSESESEPESESESRRVTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 AKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSSDSESESEPESESESRRVTK
700 710 720 730 740 750
800 810 820 830 840 850
pF1KE4 EKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSPSLMADLEGLHLSTSSSVIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 EKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSPSLMADLEGLHLSTSSSVIS
760 770 780 790 800 810
860 870 880 890 900 910
pF1KE4 VSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMVSIQITLNNTTDRKIENIHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 VSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMVSIQITLNNTTDRKIENIHI
820 830 840 850 860 870
920 930 940 950 960 970
pF1KE4 GEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 GEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPV
880 890 900 910 920 930
980 990 1000 1010 1020 1030
pF1KE4 GELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 GELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQ
940 950 960 970 980 990
1040 1050 1060 1070 1080 1090
pF1KE4 DNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIGSVLLRELKPVLSQG
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 DNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIGSVLLRELKPVLSQG
1000 1010 1020 1030 1040
>>CCDS61737.1 AP3B2 gene_id:8120|Hs108|chr15 (1101 aa)
initn: 4448 init1: 2052 opt: 2944 Z-score: 1673.4 bits: 321.4 E(32554): 6.9e-87
Smith-Waterman score: 4225; 62.2% identity (82.2% similar) in 1115 aa overlap (8-1093:7-1101)
10 20 30 40 50 60
pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL
:.:..::. . :. . :: :.:::: :...:::.::..:::: ::
CCDS61 MSAAPAYSEDKGGSAGP--GEPEYGHDPASG--GIFSSDYKRHDDLKEMLDTNKDSLKL
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF
.::::::.:::.:::::.:::::::::: ::::.::::::::::::::::::::::::::
CCDS61 EAMKRIVAMIARGKNASDLFPAVVKNVACKNIEVKKLVYVYLVRYAEEQQDLALLSISTF
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL
::.:::::::::::::::::::::::::::::::::::..:.::::::.::::: :::::
CCDS61 QRGLKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEAASDMSPYVRKTAAHAIPKLYSL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG
: .::..::::::::: ::.::::::::::::::::.::::::::::::::::.::::::
CCDS61 DSDQKDQLIEVIEKLLADKTTLVAGSVVMAFEEVCPERIDLIHKNYRKLCNLLIDVEEWG
180 190 200 210 220 230
250 260 270 280 290
pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNG-KNFYESDDDQ-----KEKTDK----KKKP
::::: ::::::::::.:: .. . ::.:. : :: :..:. .:.: ..::
CCDS61 QVVIISMLTRYARTQFLSPTQNESLLEENAEKAFYGSEEDEAKGAGSEETAAAAAPSRKP
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 YTMDPDHRLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQ
:.::::::::.::::::::::.:::::::::::.:..::.:.:.:.:.:::::::. :::
CCDS61 YVMDPDHRLLLRNTKPLLQSRSAAVVMAVAQLYFHLAPKAEVGVIAKALVRLLRSHSEVQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 YIVLQNIATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQ
:.::::.:::::.:.:::::::::::.::::::.:: ::::.:::::::.:: :.:::::
CCDS61 YVVLQNVATMSIKRRGMFEPYLKSFYIRSTDPTQIKILKLEVLTNLANETNIPTVLREFQ
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 TYVKSQDKQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQ
::..:.::.:.:::::.:::::::: .: :::::::: :::::::.::::::::::::::
CCDS61 TYIRSMDKDFVAATIQAIGRCATNIGRVRDTCLNGLVQLLSNRDELVVAESVVVIKKLLQ
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE4 MQPAQHGEIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDD
::::::::::::.::: :.: ::.::::::::::: ::.::.::::::::::::::.:.:
CCDS61 MQPAQHGEIIKHLAKLTDNIQVPMARASILWLIGEYCEHVPRIAPDVLRKMAKSFTAEED
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE4 LVKLQILNLGAKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGAL
.::::..::.:::::::::::::::::.:.:.:::::::::::.:: ::::::.:..:::
CCDS61 IVKLQVINLAAKLYLTNSKQTKLLTQYVLSLAKYDQNYDIRDRARFTRQLIVPSEQGGAL
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE4 SKYAKKIFLAQKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRN
:..:::.::: ::::.::: ::::::::::.::: :: ::::: :: .::: ::::::::
CCDS61 SRHAKKLFLAPKPAPVLESSFKDRDHFQLGSLSHLLNAKATGYQELPDWPEEAPDPSVRN
600 610 620 630 640 650
660 670 680 690
pF1KE4 VEVIELA---------------KEWTP-AGKAKQENSAKKFYSESEEEEDSSDSS-SDSE
:: .:. ::: ... :.... : :::.:: : ..:. :: :
CCDS61 VEEEDLSLIETHVGLLGEYTEVPEWTKCSNREKRKEKEKPFYSDSEGESGPTESADSDPE
660 670 680 690 700 710
700 710 720 730 740 750
pF1KE4 SESGSESGEQGESGEEGDSNEDSSEDSSSEQDSESGRESGLENKRTAKRNSKAKGKSDSE
::: :.: ..::: .:.:...:: ...: :.:: : :... :. :: ..
CCDS61 SESESDSKSSSESGSGESSSESDNED--QDEDEEKGR--GSESEQ-----SEEDGKRKTK
720 730 740 750 760
760 770 780 790 800 810
pF1KE4 DGEKENEKSKTSDSSNDESSSIEDSSSDSESESEPESESESRRVTKEKEKKTKQDRT-PL
:. . : ::.::.: ..:::.:::: ::: :. . .. ..: .... :
CCDS61 ---KKVPERKGEASSSDEGS--DSSSSSSESEMTSESEEEQLEPASWSRKTPPSSKSAPA
770 780 790 800 810 820
820 830 840 850 860 870
pF1KE4 TKDVSLLDLDDFNPVSTPVALPTPALSPSLMADLEGLHLSTSSSVISVSTPAFVPTKTHV
::..:::::.::.: :. . : .: :: :::::: :. :. : :. .:. . .
CCDS61 TKEISLLDLEDFTPPSVQPVSPPAIVSTSLAADLEGLTLTDSTLVPSLLSPV-SGVGRQE
830 840 850 860 870 880
880 890 900 910 920 930
pF1KE4 LLHRMSGKGLAAHYFFPRQPCIFGD-KMVSIQITLNNTTDRKIENIHIGEKKLPIGMKMH
::::..:.:::. : : ::: . :: .:::..: ..:..: :...:.: ::: :....
CCDS61 LLHRVAGEGLAVDYTFSRQP-FSGDPHMVSVHIHFSNSSDTPIKGLHVGTPKLPAGISIQ
890 900 910 920 930
940 950 960 970 980 990
pF1KE4 VFNPIDSLEPEGSITVSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPVGELLLPVAMSEK
: :.:: : : :. :::.::::::.:.:::::. : :.::::::::. :: :::.
CCDS61 EFPEIESLAPGESATAVMGINFCDSTQAANFQLCTQTRQFYVSIQPPVGELMAPVFMSEN
940 950 960 970 980 990
1000 1010 1020 1030 1040 1050
pF1KE4 DFKKEQGVLTGMNETSAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQDNIHRFAAKTVH
.:::::: : :::: . .. . .. :::. .::.: :: : .. .:::..:.
CCDS61 EFKKEQGKLMGMNEITEKLMLPDTCRSDHIVVQKVTATANLGRVPCGTSDEYRFAGRTLT
1000 1010 1020 1030 1040 1050
1060 1070 1080 1090
pF1KE4 SGSLMLVTVELKEGSTAQLIINTEKTVIGSVLLRELKPVLSQG
.:::.:.:.. . ...::: .:.:: :::..:.... .:.:
CCDS61 GGSLVLLTLDARPAGAAQLTVNSEKMVIGTMLVKDVIQALTQ
1060 1070 1080 1090 1100
>>CCDS61736.1 AP3B2 gene_id:8120|Hs108|chr15 (1050 aa)
initn: 3866 init1: 2097 opt: 2189 Z-score: 1249.5 bits: 242.9 E(32554): 2.8e-63
Smith-Waterman score: 3993; 60.4% identity (80.2% similar) in 1100 aa overlap (8-1093:7-1050)
10 20 30 40 50 60
pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL
:.:..::. . :. . :: :.:::: :...:::.::..:::: ::
CCDS61 MSAAPAYSEDKGGSAGP--GEPEYGHDPASG--GIFSSDYKRHDDLKEMLDTNKDSLKL
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF
.::::::.:::.:::::.:::::::::: ::::
CCDS61 EAMKRIVAMIARGKNASDLFPAVVKNVACKNIE---------------------------
60 70 80
130 140 150 160 170 180
pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL
:::::::::::::::::::::::::::::::::..:.::::::.::::: :::::
CCDS61 -----DPNQLIRASALRVLSSIRVPIIVPIMMLAIKEAASDMSPYVRKTAAHAIPKLYSL
90 100 110 120 130 140
190 200 210 220 230 240
pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG
: .::..::::::::: ::.::::::::::::::::.::::::::::::::::.::::::
CCDS61 DSDQKDQLIEVIEKLLADKTTLVAGSVVMAFEEVCPERIDLIHKNYRKLCNLLIDVEEWG
150 160 170 180 190 200
250 260 270 280 290
pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNG-KNFYESDDDQ-----KEKTDK----KKKP
::::: ::::::::::.:: .. . ::.:. : :: :..:. .:.: ..::
CCDS61 QVVIISMLTRYARTQFLSPTQNESLLEENAEKAFYGSEEDEAKGAGSEETAAAAAPSRKP
210 220 230 240 250 260
300 310 320 330 340 350
pF1KE4 YTMDPDHRLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQ
:.::::::::.::::::::::.:::::::::::.:..::.:.:.:.:.:::::::. :::
CCDS61 YVMDPDHRLLLRNTKPLLQSRSAAVVMAVAQLYFHLAPKAEVGVIAKALVRLLRSHSEVQ
270 280 290 300 310 320
360 370 380 390 400 410
pF1KE4 YIVLQNIATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQ
:.::::.:::::.:.:::::::::::.::::::.:: ::::.:::::::.:: :.:::::
CCDS61 YVVLQNVATMSIKRRGMFEPYLKSFYIRSTDPTQIKILKLEVLTNLANETNIPTVLREFQ
330 340 350 360 370 380
420 430 440 450 460 470
pF1KE4 TYVKSQDKQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQ
::..:.::.:.:::::.:::::::: .: :::::::: :::::::.::::::::::::::
CCDS61 TYIRSMDKDFVAATIQAIGRCATNIGRVRDTCLNGLVQLLSNRDELVVAESVVVIKKLLQ
390 400 410 420 430 440
480 490 500 510 520 530
pF1KE4 MQPAQHGEIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDD
::::::::::::.::: :.: ::.::::::::::: ::.::.::::::::::::::.:.:
CCDS61 MQPAQHGEIIKHLAKLTDNIQVPMARASILWLIGEYCEHVPRIAPDVLRKMAKSFTAEED
450 460 470 480 490 500
540 550 560 570 580 590
pF1KE4 LVKLQILNLGAKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGAL
.::::..::.:::::::::::::::::.:.:.:::::::::::.:: ::::::.:..:::
CCDS61 IVKLQVINLAAKLYLTNSKQTKLLTQYVLSLAKYDQNYDIRDRARFTRQLIVPSEQGGAL
510 520 530 540 550 560
600 610 620 630 640 650
pF1KE4 SKYAKKIFLAQKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRN
:..:::.::: ::::.::: ::::::::::.::: :: ::::: :: .::: ::::::::
CCDS61 SRHAKKLFLAPKPAPVLESSFKDRDHFQLGSLSHLLNAKATGYQELPDWPEEAPDPSVRN
570 580 590 600 610 620
660 670 680 690 700
pF1KE4 VEVIELAKEWTP-AGKAKQENSAKKFYSESEEEEDSSDSS-SDSESESGSESGEQGESGE
::: ::: ... :.... : :::.:: : ..:. :: :::: :.: ..:::
CCDS61 VEV----PEWTKCSNREKRKEKEKPFYSDSEGESGPTESADSDPESESESDSKSSSESGS
630 640 650 660 670
710 720 730 740 750 760
pF1KE4 EGDSNEDSSEDSSSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSS
.:.:...:: ...: :.:: : :... :. :: .. :. . : ::
CCDS61 GESSSESDNED--QDEDEEKGR--GSESEQ-----SEEDGKRKTK---KKVPERKGEASS
680 690 700 710 720
770 780 790 800 810 820
pF1KE4 NDESSSIEDSSSDSESESEPESESESRRVTKEKEKKTKQDRT-PLTKDVSLLDLDDFNPV
.::.: ..:::.:::: ::: :. . .. ..: .... : ::..:::::.::.:
CCDS61 SDEGS--DSSSSSSESEMTSESEEEQLEPASWSRKTPPSSKSAPATKEISLLDLEDFTPP
730 740 750 760 770 780
830 840 850 860 870 880
pF1KE4 STPVALPTPALSPSLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYF
:. . : .: :: :::::: :. :. : :. .:. . . ::::..:.:::. :
CCDS61 SVQPVSPPAIVSTSLAADLEGLTLTDSTLVPSLLSPV-SGVGRQELLHRVAGEGLAVDYT
790 800 810 820 830 840
890 900 910 920 930 940
pF1KE4 FPRQPCIFGD-KMVSIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSIT
: ::: . :: .:::..: ..:..: :...:.: ::: :.... : :.:: : : :
CCDS61 FSRQP-FSGDPHMVSVHIHFSNSSDTPIKGLHVGTPKLPAGISIQEFPEIESLAPGESAT
850 860 870 880 890 900
950 960 970 980 990 1000
pF1KE4 VSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNET
. :::.::::::.:.:::::. : :.::::::::. :: :::..:::::: : ::::
CCDS61 AVMGINFCDSTQAANFQLCTQTRQFYVSIQPPVGELMAPVFMSENEFKKEQGKLMGMNEI
910 920 930 940 950 960
1010 1020 1030 1040 1050 1060
pF1KE4 SAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGS
. .. . .. :::. .::.: :: : .. .:::..:. .:::.:.:.. . ..
CCDS61 TEKLMLPDTCRSDHIVVQKVTATANLGRVPCGTSDEYRFAGRTLTGGSLVLLTLDARPAG
970 980 990 1000 1010 1020
1070 1080 1090
pF1KE4 TAQLIINTEKTVIGSVLLRELKPVLSQG
.::: .:.:: :::..:.... .:.:
CCDS61 AAQLTVNSEKMVIGTMLVKDVIQALTQ
1030 1040 1050
>>CCDS45331.1 AP3B2 gene_id:8120|Hs108|chr15 (1082 aa)
initn: 4338 init1: 2097 opt: 2189 Z-score: 1249.4 bits: 242.9 E(32554): 2.9e-63
Smith-Waterman score: 4251; 63.1% identity (83.1% similar) in 1100 aa overlap (8-1093:7-1082)
10 20 30 40 50 60
pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL
:.:..::. . :. . :: :.:::: :...:::.::..:::: ::
CCDS45 MSAAPAYSEDKGGSAGP--GEPEYGHDPASG--GIFSSDYKRHDDLKEMLDTNKDSLKL
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF
.::::::.:::.:::::.:::::::::: ::::.::::::::::::::::::::::::::
CCDS45 EAMKRIVAMIARGKNASDLFPAVVKNVACKNIEVKKLVYVYLVRYAEEQQDLALLSISTF
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL
::.:::::::::::::::::::::::::::::::::::..:.::::::.::::: :::::
CCDS45 QRGLKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEAASDMSPYVRKTAAHAIPKLYSL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG
: .::..::::::::: ::.::::::::::::::::.::::::::::::::::.::::::
CCDS45 DSDQKDQLIEVIEKLLADKTTLVAGSVVMAFEEVCPERIDLIHKNYRKLCNLLIDVEEWG
180 190 200 210 220 230
250 260 270 280 290
pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNG-KNFYESDDDQ-----KEKTDK----KKKP
::::: ::::::::::.:: .. . ::.:. : :: :..:. .:.: ..::
CCDS45 QVVIISMLTRYARTQFLSPTQNESLLEENAEKAFYGSEEDEAKGAGSEETAAAAAPSRKP
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 YTMDPDHRLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQ
:.::::::::.::::::::::.:::::::::::.:..::.:.:.:.:.:::::::. :::
CCDS45 YVMDPDHRLLLRNTKPLLQSRSAAVVMAVAQLYFHLAPKAEVGVIAKALVRLLRSHSEVQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 YIVLQNIATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQ
:.::::.:::::.:.:::::::::::.::::::.:: ::::.:::::::.:: :.:::::
CCDS45 YVVLQNVATMSIKRRGMFEPYLKSFYIRSTDPTQIKILKLEVLTNLANETNIPTVLREFQ
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 TYVKSQDKQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQ
::..:.::.:.:::::.:::::::: .: :::::::: :::::::.::::::::::::::
CCDS45 TYIRSMDKDFVAATIQAIGRCATNIGRVRDTCLNGLVQLLSNRDELVVAESVVVIKKLLQ
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE4 MQPAQHGEIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDD
::::::::::::.::: :.: ::.::::::::::: ::.::.::::::::::::::.:.:
CCDS45 MQPAQHGEIIKHLAKLTDNIQVPMARASILWLIGEYCEHVPRIAPDVLRKMAKSFTAEED
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE4 LVKLQILNLGAKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGAL
.::::..::.:::::::::::::::::.:.:.:::::::::::.:: ::::::.:..:::
CCDS45 IVKLQVINLAAKLYLTNSKQTKLLTQYVLSLAKYDQNYDIRDRARFTRQLIVPSEQGGAL
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE4 SKYAKKIFLAQKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRN
:..:::.::: ::::.::: ::::::::::.::: :: ::::: :: .::: ::::::::
CCDS45 SRHAKKLFLAPKPAPVLESSFKDRDHFQLGSLSHLLNAKATGYQELPDWPEEAPDPSVRN
600 610 620 630 640 650
660 670 680 690 700
pF1KE4 VEVIELAKEWTP-AGKAKQENSAKKFYSESEEEEDSSDSS-SDSESESGSESGEQGESGE
::: ::: ... :.... : :::.:: : ..:. :: :::: :.: ..:::
CCDS45 VEV----PEWTKCSNREKRKEKEKPFYSDSEGESGPTESADSDPESESESDSKSSSESGS
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE4 EGDSNEDSSEDSSSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSS
.:.:...:: ...: :.:: : :... :. :: .. :. . : ::
CCDS45 GESSSESDNED--QDEDEEKGR--GSESEQ-----SEEDGKRKTK---KKVPERKGEASS
720 730 740 750
770 780 790 800 810 820
pF1KE4 NDESSSIEDSSSDSESESEPESESESRRVTKEKEKKTKQDRT-PLTKDVSLLDLDDFNPV
.::.: ..:::.:::: ::: :. . .. ..: .... : ::..:::::.::.:
CCDS45 SDEGS--DSSSSSSESEMTSESEEEQLEPASWSRKTPPSSKSAPATKEISLLDLEDFTPP
760 770 780 790 800 810
830 840 850 860 870 880
pF1KE4 STPVALPTPALSPSLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYF
:. . : .: :: :::::: :. :. : :. .:. . . ::::..:.:::. :
CCDS45 SVQPVSPPAIVSTSLAADLEGLTLTDSTLVPSLLSPV-SGVGRQELLHRVAGEGLAVDYT
820 830 840 850 860 870
890 900 910 920 930 940
pF1KE4 FPRQPCIFGD-KMVSIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSIT
: ::: . :: .:::..: ..:..: :...:.: ::: :.... : :.:: : : :
CCDS45 FSRQP-FSGDPHMVSVHIHFSNSSDTPIKGLHVGTPKLPAGISIQEFPEIESLAPGESAT
880 890 900 910 920 930
950 960 970 980 990 1000
pF1KE4 VSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNET
. :::.::::::.:.:::::. : :.::::::::. :: :::..:::::: : ::::
CCDS45 AVMGINFCDSTQAANFQLCTQTRQFYVSIQPPVGELMAPVFMSENEFKKEQGKLMGMNEI
940 950 960 970 980 990
1010 1020 1030 1040 1050 1060
pF1KE4 SAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGS
. .. . .. :::. .::.: :: : .. .:::..:. .:::.:.:.. . ..
CCDS45 TEKLMLPDTCRSDHIVVQKVTATANLGRVPCGTSDEYRFAGRTLTGGSLVLLTLDARPAG
1000 1010 1020 1030 1040 1050
1070 1080 1090
pF1KE4 TAQLIINTEKTVIGSVLLRELKPVLSQG
.::: .:.:: :::..:.... .:.:
CCDS45 AAQLTVNSEKMVIGTMLVKDVIQALTQ
1060 1070 1080
>>CCDS54515.1 AP1B1 gene_id:162|Hs108|chr22 (919 aa)
initn: 800 init1: 396 opt: 535 Z-score: 321.2 bits: 70.9 E(32554): 1.4e-11
Smith-Waterman score: 923; 29.0% identity (62.9% similar) in 614 aa overlap (37-635:6-583)
10 20 30 40 50 60
pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK
. . ::.: .:: :.:.: : .:.:
CCDS54 MTDSKYFTTTKKGEIFELKAELNSDKKEKKKEAVK
10 20 30
70 80 90 100 110 120
pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL
.... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:.....:: .
CCDS54 KVIASMTVGKDVSALFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNTFVKDC
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPE-
.::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... .
CCDS54 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQL
100 110 120 130 140 150
190 200 210 220 230
pF1KE4 -QKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDR-----IDLIHKNYRKLCNLLVDVE
. . ...... :..:.. .:....: :. :. .. .:: .. :: . : .
CCDS54 VEDQGFLDTLKDLISDSNPMVVANAVAALSEIAESHPSSNLLDLNPQSINKLLTALNECT
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH
::::. :. :. :.. .:: . .. .. : .
CCDS54 EWGQIFILDCLA----------------------NYMPKDDREAQSICERVTPRLSHANS
220 230 240 250
300 310 320 330 340 350
pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI
... .: :.. . : .: .. . .. .. :: :: .. :.::..:.::
CCDS54 AVVLSAVKVLMKFME----MLSKDLDYYGTLLKK---LAPPLVTLLSAEPELQYVALRNI
260 270 280 290 300
360 370 380 390 400 410
pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD
. .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. :
CCDS54 NLIVQKRPEILKHEMKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG
.:. ....::::: .. . .. :.. :. :.... . :: :..:::: ... : ..
CCDS54 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIKDIFRKYPNKYE
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL
.: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.::.:
CCDS54 SVIATLCENLDSLDEPEARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLQLL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK
. .::.: . .:. :.: .:.:. :. : :.::: . .:. . . ::.
CCDS54 TAIVKLFLKKPTETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVA------AKE
490 500 510 520 530
600 610 620 630 640 650
pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV
. ::.:: . :.: . :. .:::. . . ....:
CCDS54 VVLAEKPLISEETDLIEPTLLDELICYIGTLASVYHKPPSAFVEGGRGVVHKSLPPRTAS
540 550 560 570 580 590
660 670 680 690 700 710
pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD
CCDS54 SESAESPETAPTGAPPGEQPDVIPAQGDLLGDLLNLDLGPPVSGPPLATSSVQMGAVDLL
600 610 620 630 640 650
>>CCDS13856.2 AP1B1 gene_id:162|Hs108|chr22 (939 aa)
initn: 800 init1: 396 opt: 535 Z-score: 321.1 bits: 71.0 E(32554): 1.5e-11
Smith-Waterman score: 923; 29.0% identity (62.9% similar) in 614 aa overlap (37-635:6-583)
10 20 30 40 50 60
pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK
. . ::.: .:: :.:.: : .:.:
CCDS13 MTDSKYFTTTKKGEIFELKAELNSDKKEKKKEAVK
10 20 30
70 80 90 100 110 120
pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL
.... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:.....:: .
CCDS13 KVIASMTVGKDVSALFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNTFVKDC
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPE-
.::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... .
CCDS13 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQL
100 110 120 130 140 150
190 200 210 220 230
pF1KE4 -QKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDR-----IDLIHKNYRKLCNLLVDVE
. . ...... :..:.. .:....: :. :. .. .:: .. :: . : .
CCDS13 VEDQGFLDTLKDLISDSNPMVVANAVAALSEIAESHPSSNLLDLNPQSINKLLTALNECT
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH
::::. :. :. :.. .:: . .. .. : .
CCDS13 EWGQIFILDCLA----------------------NYMPKDDREAQSICERVTPRLSHANS
220 230 240 250
300 310 320 330 340 350
pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI
... .: :.. . : .: .. . .. .. :: :: .. :.::..:.::
CCDS13 AVVLSAVKVLMKFME----MLSKDLDYYGTLLKK---LAPPLVTLLSAEPELQYVALRNI
260 270 280 290 300
360 370 380 390 400 410
pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD
. .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. :
CCDS13 NLIVQKRPEILKHEMKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG
.:. ....::::: .. . .. :.. :. :.... . :: :..:::: ... : ..
CCDS13 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIKDIFRKYPNKYE
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL
.: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.::.:
CCDS13 SVIATLCENLDSLDEPEARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLQLL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK
. .::.: . .:. :.: .:.:. :. : :.::: . .:. . . ::.
CCDS13 TAIVKLFLKKPTETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVA------AKE
490 500 510 520 530
600 610 620 630 640 650
pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV
. ::.:: . :.: . :. .:::. . . ....:
CCDS13 VVLAEKPLISEETDLIEPTLLDELICYIGTLASVYHKPPSAFVEGGRGVVHKSLPPRTAS
540 550 560 570 580 590
660 670 680 690 700 710
pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD
CCDS13 SESAESPETAPTGAPPGEQPDVIPAQGDLLGDLLNLDLGPPVSGPPLATSSVQMGAVDLL
600 610 620 630 640 650
>>CCDS13855.1 AP1B1 gene_id:162|Hs108|chr22 (949 aa)
initn: 800 init1: 396 opt: 535 Z-score: 321.0 bits: 71.0 E(32554): 1.5e-11
Smith-Waterman score: 923; 29.0% identity (62.9% similar) in 614 aa overlap (37-635:6-583)
10 20 30 40 50 60
pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK
. . ::.: .:: :.:.: : .:.:
CCDS13 MTDSKYFTTTKKGEIFELKAELNSDKKEKKKEAVK
10 20 30
70 80 90 100 110 120
pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL
.... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:.....:: .
CCDS13 KVIASMTVGKDVSALFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNTFVKDC
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPE-
.::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... .
CCDS13 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQL
100 110 120 130 140 150
190 200 210 220 230
pF1KE4 -QKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDR-----IDLIHKNYRKLCNLLVDVE
. . ...... :..:.. .:....: :. :. .. .:: .. :: . : .
CCDS13 VEDQGFLDTLKDLISDSNPMVVANAVAALSEIAESHPSSNLLDLNPQSINKLLTALNECT
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH
::::. :. :. :.. .:: . .. .. : .
CCDS13 EWGQIFILDCLA----------------------NYMPKDDREAQSICERVTPRLSHANS
220 230 240 250
300 310 320 330 340 350
pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI
... .: :.. . : .: .. . .. .. :: :: .. :.::..:.::
CCDS13 AVVLSAVKVLMKFME----MLSKDLDYYGTLLKK---LAPPLVTLLSAEPELQYVALRNI
260 270 280 290 300
360 370 380 390 400 410
pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD
. .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. :
CCDS13 NLIVQKRPEILKHEMKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG
.:. ....::::: .. . .. :.. :. :.... . :: :..:::: ... : ..
CCDS13 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIKDIFRKYPNKYE
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL
.: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.::.:
CCDS13 SVIATLCENLDSLDEPEARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLQLL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK
. .::.: . .:. :.: .:.:. :. : :.::: . .:. . . ::.
CCDS13 TAIVKLFLKKPTETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVA------AKE
490 500 510 520 530
600 610 620 630 640 650
pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV
. ::.:: . :.: . :. .:::. . . ....:
CCDS13 VVLAEKPLISEETDLIEPTLLDELICYIGTLASVYHKPPSAFVEGGRGVVHKSLPPRTAS
540 550 560 570 580 590
660 670 680 690 700 710
pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD
CCDS13 SESAESPETAPTGAPPGEQPDVIPAQGDLLGDLLNLDLGPPVSGPPLATSSVQMGAVDLL
600 610 620 630 640 650
>>CCDS32622.1 AP2B1 gene_id:163|Hs108|chr17 (937 aa)
initn: 787 init1: 396 opt: 528 Z-score: 317.1 bits: 70.2 E(32554): 2.4e-11
Smith-Waterman score: 911; 29.0% identity (63.2% similar) in 617 aa overlap (37-638:7-586)
10 20 30 40 50 60
pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK
:... ::.: .:: :...: . .:.:
CCDS32 MTDSKYFTTN-KKGEIFELKAELNNEKKEKRKEAVK
10 20 30
70 80 90 100 110 120
pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL
.... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:......: .
CCDS32 KVIAAMTVGKDVSSLFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNSFVKDC
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQ
.::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... ..
CCDS32 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQM
100 110 120 130 140 150
190 200 210 220 230
pF1KE4 KE--MLIEVIEKLLKDKSTLVAGSVVMAFEEVC---PDR--IDLIHKNYRKLCNLLVDVE
: ... .. :. :.. .:....: :. :. :. .:: .: :: . : .
CCDS32 VEDQGFLDSLRDLIADSNPMVVANAVAALSEISESHPNSNLLDLNPQNINKLLTALNECT
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH
::::. :. :. : .: .:: . .. .. : .
CCDS32 EWGQIFILDCLSNY------NP----------------KDDREAQSICERVTPRLSHANS
220 230 240 250
300 310 320 330 340 350
pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI
... .: :.. . .. . :... :. .. :: :: .. ::::..:.::
CCDS32 AVVLSAVKVLMKFLE---LLPKDSDYYNMLLKK----LAPPLVTLLSGEPEVQYVALRNI
260 270 280 290 300
360 370 380 390 400 410
pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD
. .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. :
CCDS32 NLIVQKRPEILKQEIKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG
.:. ....::::: .. . .. :.. :. :.... . :: :..:::. ... : ..
CCDS32 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIRDIFRKYPNKYE
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL
:: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.: .:
CCDS32 SIIATLCENLDSLDEPDARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLTLL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK
. .::.: . ..:. :.: .:.:. :. : :.::: . .:. . . ::.
CCDS32 TAIVKLFLKKPSETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVT------AKE
490 500 510 520 530
600 610 620 630 640 650
pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV
. :..:: . :.: . :. ..:.:. . . ....: :.
CCDS32 VVLSEKPLISEETDLIEPTLLDELICHIGSLASVYHKPPNAFVEGSHGIHRKHLPIHHGS
540 550 560 570 580 590
660 670 680 690 700 710
pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD
CCDS32 TDAGDSPVGTTTATNLEQPQVIPSQGDLLGDLLNLDLGPPVNVPQVSSMQMGAVDLLGGG
600 610 620 630 640 650
>>CCDS32621.1 AP2B1 gene_id:163|Hs108|chr17 (951 aa)
initn: 787 init1: 396 opt: 528 Z-score: 317.0 bits: 70.2 E(32554): 2.4e-11
Smith-Waterman score: 911; 29.0% identity (63.2% similar) in 617 aa overlap (37-638:7-586)
10 20 30 40 50 60
pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK
:... ::.: .:: :...: . .:.:
CCDS32 MTDSKYFTTN-KKGEIFELKAELNNEKKEKRKEAVK
10 20 30
70 80 90 100 110 120
pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL
.... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:......: .
CCDS32 KVIAAMTVGKDVSSLFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNSFVKDC
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQ
.::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... ..
CCDS32 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQM
100 110 120 130 140 150
190 200 210 220 230
pF1KE4 KE--MLIEVIEKLLKDKSTLVAGSVVMAFEEVC---PDR--IDLIHKNYRKLCNLLVDVE
: ... .. :. :.. .:....: :. :. :. .:: .: :: . : .
CCDS32 VEDQGFLDSLRDLIADSNPMVVANAVAALSEISESHPNSNLLDLNPQNINKLLTALNECT
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH
::::. :. :. : .: .:: . .. .. : .
CCDS32 EWGQIFILDCLSNY------NP----------------KDDREAQSICERVTPRLSHANS
220 230 240 250
300 310 320 330 340 350
pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI
... .: :.. . .. . :... :. .. :: :: .. ::::..:.::
CCDS32 AVVLSAVKVLMKFLE---LLPKDSDYYNMLLKK----LAPPLVTLLSGEPEVQYVALRNI
260 270 280 290 300
360 370 380 390 400 410
pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD
. .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. :
CCDS32 NLIVQKRPEILKQEIKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG
.:. ....::::: .. . .. :.. :. :.... . :: :..:::. ... : ..
CCDS32 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIRDIFRKYPNKYE
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL
:: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.: .:
CCDS32 SIIATLCENLDSLDEPDARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLTLL
430 440 450 460 470 480
540 550 560 570 580 590
pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK
. .::.: . ..:. :.: .:.:. :. : :.::: . .:. . . ::.
CCDS32 TAIVKLFLKKPSETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVT------AKE
490 500 510 520 530
600 610 620 630 640 650
pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV
. :..:: . :.: . :. ..:.:. . . ....: :.
CCDS32 VVLSEKPLISEETDLIEPTLLDELICHIGSLASVYHKPPNAFVEGSHGIHRKHLPIHHGS
540 550 560 570 580 590
660 670 680 690 700 710
pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD
CCDS32 TDAGDSPVGTTTATNLEQPQVIPSQGDLLGDLLNLDLGPPVNVPQVSSMQMGAVDLLGGG
600 610 620 630 640 650
1094 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 14:45:45 2016 done: Mon Nov 7 14:45:45 2016
Total Scan time: 4.590 Total Display time: 0.370
Function used was FASTA [36.3.4 Apr, 2011]