FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4590, 1094 aa 1>>>pF1KE4590 1094 - 1094 aa - 1094 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.5129+/-0.00162; mu= -1.9111+/- 0.098 mean_var=316.8804+/-64.296, 0's: 0 Z-trim(106.8): 64 B-trim: 254 in 1/51 Lambda= 0.072049 statistics sampled from 9152 (9191) to 9152 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.282), width: 16 Scan time: 4.590 The best scores are: opt bits E(32554) CCDS4041.1 AP3B1 gene_id:8546|Hs108|chr5 (1094) 6942 737.0 5.5e-212 CCDS64186.1 AP3B1 gene_id:8546|Hs108|chr5 (1045) 6629 704.4 3.3e-202 CCDS61737.1 AP3B2 gene_id:8120|Hs108|chr15 (1101) 2944 321.4 6.9e-87 CCDS61736.1 AP3B2 gene_id:8120|Hs108|chr15 (1050) 2189 242.9 2.8e-63 CCDS45331.1 AP3B2 gene_id:8120|Hs108|chr15 (1082) 2189 242.9 2.9e-63 CCDS54515.1 AP1B1 gene_id:162|Hs108|chr22 ( 919) 535 70.9 1.4e-11 CCDS13856.2 AP1B1 gene_id:162|Hs108|chr22 ( 939) 535 71.0 1.5e-11 CCDS13855.1 AP1B1 gene_id:162|Hs108|chr22 ( 949) 535 71.0 1.5e-11 CCDS32622.1 AP2B1 gene_id:163|Hs108|chr17 ( 937) 528 70.2 2.4e-11 CCDS32621.1 AP2B1 gene_id:163|Hs108|chr17 ( 951) 528 70.2 2.4e-11 >>CCDS4041.1 AP3B1 gene_id:8546|Hs108|chr5 (1094 aa) initn: 6942 init1: 6942 opt: 6942 Z-score: 3919.4 bits: 737.0 E(32554): 5.5e-212 Smith-Waterman score: 6942; 99.9% identity (99.9% similar) in 1094 aa overlap (1-1094:1-1094) 10 20 30 40 50 60 pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 QVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 IRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 IRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 SIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 AAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 AAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEII 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 KHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 KHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 AKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGALSKYAKKIFLA :::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::: CCDS40 AKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNVKSGALSKYAKKIFLA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 QKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 QKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEW 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 TPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 TPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 SSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSS 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 DSESESEPESESESRRVTKEKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DSESESEPESESESRRVTKEKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 SLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMV 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 SIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 SFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 SFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPS 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE4 VIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 VIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIG 1030 1040 1050 1060 1070 1080 1090 pF1KE4 SVLLRELKPVLSQG :::::::::::::: CCDS40 SVLLRELKPVLSQG 1090 >>CCDS64186.1 AP3B1 gene_id:8546|Hs108|chr5 (1045 aa) initn: 6629 init1: 6629 opt: 6629 Z-score: 3743.8 bits: 704.4 E(32554): 3.3e-202 Smith-Waterman score: 6629; 99.9% identity (99.9% similar) in 1045 aa overlap (50-1094:1-1045) 20 30 40 50 60 70 pF1KE4 LGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKLDAMKRIVGMIAKGKNASEL :::::::::::::::::::::::::::::: CCDS64 MLESNKDSAKLDAMKRIVGMIAKGKNASEL 10 20 30 80 90 100 110 120 130 pF1KE4 FPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRALKDPNQLIRASALRVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 FPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRALKDPNQLIRASALRVL 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE4 SSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQKEMLIEVIEKLLKDK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 SSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQKEMLIEVIEKLLKDK 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE4 STLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWGQVVIIHMLTRYARTQFVSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 STLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWGQVVIIHMLTRYARTQFVSP 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE4 WKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLLIRNTKPLLQSRNAAVVMAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 WKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDHRLLIRNTKPLLQSRNAAVVMAV 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE4 AQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATMSIQRKGMFEPYLKSFYVRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 AQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNIATMSIQRKGMFEPYLKSFYVRS 280 290 300 310 320 330 380 390 400 410 420 430 pF1KE4 TDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQFAAATIQTIGRCATNILEVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 TDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQDKQFAAATIQTIGRCATNILEVT 340 350 360 370 380 390 440 450 460 470 480 490 pF1KE4 DTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEIIKHMAKLLDSITVPVARASI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 DTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHGEIIKHMAKLLDSITVPVARASI 400 410 420 430 440 450 500 510 520 530 540 550 pF1KE4 LWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLGAKLYLTNSKQTKLLTQYIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 LWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQILNLGAKLYLTNSKQTKLLTQYIL 460 470 480 490 500 510 560 570 580 590 600 610 pF1KE4 NLGKYDQNYDIRDRTRFIRQLIVPNEKSGALSKYAKKIFLAQKPAPLLESPFKDRDHFQL ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::::: CCDS64 NLGKYDQNYDIRDRTRFIRQLIVPNVKSGALSKYAKKIFLAQKPAPLLESPFKDRDHFQL 520 530 540 550 560 570 620 630 640 650 660 670 pF1KE4 GTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEWTPAGKAKQENSAKKFYSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 GTLSHTLNIKATGYLELSNWPEVAPDPSVRNVEVIELAKEWTPAGKAKQENSAKKFYSES 580 590 600 610 620 630 680 690 700 710 720 730 pF1KE4 EEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDSSSEQDSESGRESGLENKRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 EEEEDSSDSSSDSESESGSESGEQGESGEEGDSNEDSSEDSSSEQDSESGRESGLENKRT 640 650 660 670 680 690 740 750 760 770 780 790 pF1KE4 AKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSSDSESESEPESESESRRVTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 AKRNSKAKGKSDSEDGEKENEKSKTSDSSNDESSSIEDSSSDSESESEPESESESRRVTK 700 710 720 730 740 750 800 810 820 830 840 850 pF1KE4 EKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSPSLMADLEGLHLSTSSSVIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 EKEKKTKQDRTPLTKDVSLLDLDDFNPVSTPVALPTPALSPSLMADLEGLHLSTSSSVIS 760 770 780 790 800 810 860 870 880 890 900 910 pF1KE4 VSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMVSIQITLNNTTDRKIENIHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 VSTPAFVPTKTHVLLHRMSGKGLAAHYFFPRQPCIFGDKMVSIQITLNNTTDRKIENIHI 820 830 840 850 860 870 920 930 940 950 960 970 pF1KE4 GEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 GEKKLPIGMKMHVFNPIDSLEPEGSITVSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPV 880 890 900 910 920 930 980 990 1000 1010 1020 1030 pF1KE4 GELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 GELLLPVAMSEKDFKKEQGVLTGMNETSAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQ 940 950 960 970 980 990 1040 1050 1060 1070 1080 1090 pF1KE4 DNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIGSVLLRELKPVLSQG ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS64 DNIHRFAAKTVHSGSLMLVTVELKEGSTAQLIINTEKTVIGSVLLRELKPVLSQG 1000 1010 1020 1030 1040 >>CCDS61737.1 AP3B2 gene_id:8120|Hs108|chr15 (1101 aa) initn: 4448 init1: 2052 opt: 2944 Z-score: 1673.4 bits: 321.4 E(32554): 6.9e-87 Smith-Waterman score: 4225; 62.2% identity (82.2% similar) in 1115 aa overlap (8-1093:7-1101) 10 20 30 40 50 60 pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL :.:..::. . :. . :: :.:::: :...:::.::..:::: :: CCDS61 MSAAPAYSEDKGGSAGP--GEPEYGHDPASG--GIFSSDYKRHDDLKEMLDTNKDSLKL 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF .::::::.:::.:::::.:::::::::: ::::.:::::::::::::::::::::::::: CCDS61 EAMKRIVAMIARGKNASDLFPAVVKNVACKNIEVKKLVYVYLVRYAEEQQDLALLSISTF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL ::.:::::::::::::::::::::::::::::::::::..:.::::::.::::: ::::: CCDS61 QRGLKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEAASDMSPYVRKTAAHAIPKLYSL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG : .::..::::::::: ::.::::::::::::::::.::::::::::::::::.:::::: CCDS61 DSDQKDQLIEVIEKLLADKTTLVAGSVVMAFEEVCPERIDLIHKNYRKLCNLLIDVEEWG 180 190 200 210 220 230 250 260 270 280 290 pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNG-KNFYESDDDQ-----KEKTDK----KKKP ::::: ::::::::::.:: .. . ::.:. : :: :..:. .:.: ..:: CCDS61 QVVIISMLTRYARTQFLSPTQNESLLEENAEKAFYGSEEDEAKGAGSEETAAAAAPSRKP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 YTMDPDHRLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQ :.::::::::.::::::::::.:::::::::::.:..::.:.:.:.:.:::::::. ::: CCDS61 YVMDPDHRLLLRNTKPLLQSRSAAVVMAVAQLYFHLAPKAEVGVIAKALVRLLRSHSEVQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 YIVLQNIATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQ :.::::.:::::.:.:::::::::::.::::::.:: ::::.:::::::.:: :.::::: CCDS61 YVVLQNVATMSIKRRGMFEPYLKSFYIRSTDPTQIKILKLEVLTNLANETNIPTVLREFQ 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 TYVKSQDKQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQ ::..:.::.:.:::::.:::::::: .: :::::::: :::::::.:::::::::::::: CCDS61 TYIRSMDKDFVAATIQAIGRCATNIGRVRDTCLNGLVQLLSNRDELVVAESVVVIKKLLQ 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 MQPAQHGEIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDD ::::::::::::.::: :.: ::.::::::::::: ::.::.::::::::::::::.:.: CCDS61 MQPAQHGEIIKHLAKLTDNIQVPMARASILWLIGEYCEHVPRIAPDVLRKMAKSFTAEED 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE4 LVKLQILNLGAKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGAL .::::..::.:::::::::::::::::.:.:.:::::::::::.:: ::::::.:..::: CCDS61 IVKLQVINLAAKLYLTNSKQTKLLTQYVLSLAKYDQNYDIRDRARFTRQLIVPSEQGGAL 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE4 SKYAKKIFLAQKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRN :..:::.::: ::::.::: ::::::::::.::: :: ::::: :: .::: :::::::: CCDS61 SRHAKKLFLAPKPAPVLESSFKDRDHFQLGSLSHLLNAKATGYQELPDWPEEAPDPSVRN 600 610 620 630 640 650 660 670 680 690 pF1KE4 VEVIELA---------------KEWTP-AGKAKQENSAKKFYSESEEEEDSSDSS-SDSE :: .:. ::: ... :.... : :::.:: : ..:. :: : CCDS61 VEEEDLSLIETHVGLLGEYTEVPEWTKCSNREKRKEKEKPFYSDSEGESGPTESADSDPE 660 670 680 690 700 710 700 710 720 730 740 750 pF1KE4 SESGSESGEQGESGEEGDSNEDSSEDSSSEQDSESGRESGLENKRTAKRNSKAKGKSDSE ::: :.: ..::: .:.:...:: ...: :.:: : :... :. :: .. CCDS61 SESESDSKSSSESGSGESSSESDNED--QDEDEEKGR--GSESEQ-----SEEDGKRKTK 720 730 740 750 760 760 770 780 790 800 810 pF1KE4 DGEKENEKSKTSDSSNDESSSIEDSSSDSESESEPESESESRRVTKEKEKKTKQDRT-PL :. . : ::.::.: ..:::.:::: ::: :. . .. ..: .... : CCDS61 ---KKVPERKGEASSSDEGS--DSSSSSSESEMTSESEEEQLEPASWSRKTPPSSKSAPA 770 780 790 800 810 820 820 830 840 850 860 870 pF1KE4 TKDVSLLDLDDFNPVSTPVALPTPALSPSLMADLEGLHLSTSSSVISVSTPAFVPTKTHV ::..:::::.::.: :. . : .: :: :::::: :. :. : :. .:. . . CCDS61 TKEISLLDLEDFTPPSVQPVSPPAIVSTSLAADLEGLTLTDSTLVPSLLSPV-SGVGRQE 830 840 850 860 870 880 880 890 900 910 920 930 pF1KE4 LLHRMSGKGLAAHYFFPRQPCIFGD-KMVSIQITLNNTTDRKIENIHIGEKKLPIGMKMH ::::..:.:::. : : ::: . :: .:::..: ..:..: :...:.: ::: :.... CCDS61 LLHRVAGEGLAVDYTFSRQP-FSGDPHMVSVHIHFSNSSDTPIKGLHVGTPKLPAGISIQ 890 900 910 920 930 940 950 960 970 980 990 pF1KE4 VFNPIDSLEPEGSITVSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPVGELLLPVAMSEK : :.:: : : :. :::.::::::.:.:::::. : :.::::::::. :: :::. CCDS61 EFPEIESLAPGESATAVMGINFCDSTQAANFQLCTQTRQFYVSIQPPVGELMAPVFMSEN 940 950 960 970 980 990 1000 1010 1020 1030 1040 1050 pF1KE4 DFKKEQGVLTGMNETSAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQDNIHRFAAKTVH .:::::: : :::: . .. . .. :::. .::.: :: : .. .:::..:. CCDS61 EFKKEQGKLMGMNEITEKLMLPDTCRSDHIVVQKVTATANLGRVPCGTSDEYRFAGRTLT 1000 1010 1020 1030 1040 1050 1060 1070 1080 1090 pF1KE4 SGSLMLVTVELKEGSTAQLIINTEKTVIGSVLLRELKPVLSQG .:::.:.:.. . ...::: .:.:: :::..:.... .:.: CCDS61 GGSLVLLTLDARPAGAAQLTVNSEKMVIGTMLVKDVIQALTQ 1060 1070 1080 1090 1100 >>CCDS61736.1 AP3B2 gene_id:8120|Hs108|chr15 (1050 aa) initn: 3866 init1: 2097 opt: 2189 Z-score: 1249.5 bits: 242.9 E(32554): 2.8e-63 Smith-Waterman score: 3993; 60.4% identity (80.2% similar) in 1100 aa overlap (8-1093:7-1050) 10 20 30 40 50 60 pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL :.:..::. . :. . :: :.:::: :...:::.::..:::: :: CCDS61 MSAAPAYSEDKGGSAGP--GEPEYGHDPASG--GIFSSDYKRHDDLKEMLDTNKDSLKL 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF .::::::.:::.:::::.:::::::::: :::: CCDS61 EAMKRIVAMIARGKNASDLFPAVVKNVACKNIE--------------------------- 60 70 80 130 140 150 160 170 180 pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL :::::::::::::::::::::::::::::::::..:.::::::.::::: ::::: CCDS61 -----DPNQLIRASALRVLSSIRVPIIVPIMMLAIKEAASDMSPYVRKTAAHAIPKLYSL 90 100 110 120 130 140 190 200 210 220 230 240 pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG : .::..::::::::: ::.::::::::::::::::.::::::::::::::::.:::::: CCDS61 DSDQKDQLIEVIEKLLADKTTLVAGSVVMAFEEVCPERIDLIHKNYRKLCNLLIDVEEWG 150 160 170 180 190 200 250 260 270 280 290 pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNG-KNFYESDDDQ-----KEKTDK----KKKP ::::: ::::::::::.:: .. . ::.:. : :: :..:. .:.: ..:: CCDS61 QVVIISMLTRYARTQFLSPTQNESLLEENAEKAFYGSEEDEAKGAGSEETAAAAAPSRKP 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE4 YTMDPDHRLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQ :.::::::::.::::::::::.:::::::::::.:..::.:.:.:.:.:::::::. ::: CCDS61 YVMDPDHRLLLRNTKPLLQSRSAAVVMAVAQLYFHLAPKAEVGVIAKALVRLLRSHSEVQ 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE4 YIVLQNIATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQ :.::::.:::::.:.:::::::::::.::::::.:: ::::.:::::::.:: :.::::: CCDS61 YVVLQNVATMSIKRRGMFEPYLKSFYIRSTDPTQIKILKLEVLTNLANETNIPTVLREFQ 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE4 TYVKSQDKQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQ ::..:.::.:.:::::.:::::::: .: :::::::: :::::::.:::::::::::::: CCDS61 TYIRSMDKDFVAATIQAIGRCATNIGRVRDTCLNGLVQLLSNRDELVVAESVVVIKKLLQ 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE4 MQPAQHGEIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDD ::::::::::::.::: :.: ::.::::::::::: ::.::.::::::::::::::.:.: CCDS61 MQPAQHGEIIKHLAKLTDNIQVPMARASILWLIGEYCEHVPRIAPDVLRKMAKSFTAEED 450 460 470 480 490 500 540 550 560 570 580 590 pF1KE4 LVKLQILNLGAKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGAL .::::..::.:::::::::::::::::.:.:.:::::::::::.:: ::::::.:..::: CCDS61 IVKLQVINLAAKLYLTNSKQTKLLTQYVLSLAKYDQNYDIRDRARFTRQLIVPSEQGGAL 510 520 530 540 550 560 600 610 620 630 640 650 pF1KE4 SKYAKKIFLAQKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRN :..:::.::: ::::.::: ::::::::::.::: :: ::::: :: .::: :::::::: CCDS61 SRHAKKLFLAPKPAPVLESSFKDRDHFQLGSLSHLLNAKATGYQELPDWPEEAPDPSVRN 570 580 590 600 610 620 660 670 680 690 700 pF1KE4 VEVIELAKEWTP-AGKAKQENSAKKFYSESEEEEDSSDSS-SDSESESGSESGEQGESGE ::: ::: ... :.... : :::.:: : ..:. :: :::: :.: ..::: CCDS61 VEV----PEWTKCSNREKRKEKEKPFYSDSEGESGPTESADSDPESESESDSKSSSESGS 630 640 650 660 670 710 720 730 740 750 760 pF1KE4 EGDSNEDSSEDSSSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSS .:.:...:: ...: :.:: : :... :. :: .. :. . : :: CCDS61 GESSSESDNED--QDEDEEKGR--GSESEQ-----SEEDGKRKTK---KKVPERKGEASS 680 690 700 710 720 770 780 790 800 810 820 pF1KE4 NDESSSIEDSSSDSESESEPESESESRRVTKEKEKKTKQDRT-PLTKDVSLLDLDDFNPV .::.: ..:::.:::: ::: :. . .. ..: .... : ::..:::::.::.: CCDS61 SDEGS--DSSSSSSESEMTSESEEEQLEPASWSRKTPPSSKSAPATKEISLLDLEDFTPP 730 740 750 760 770 780 830 840 850 860 870 880 pF1KE4 STPVALPTPALSPSLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYF :. . : .: :: :::::: :. :. : :. .:. . . ::::..:.:::. : CCDS61 SVQPVSPPAIVSTSLAADLEGLTLTDSTLVPSLLSPV-SGVGRQELLHRVAGEGLAVDYT 790 800 810 820 830 840 890 900 910 920 930 940 pF1KE4 FPRQPCIFGD-KMVSIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSIT : ::: . :: .:::..: ..:..: :...:.: ::: :.... : :.:: : : : CCDS61 FSRQP-FSGDPHMVSVHIHFSNSSDTPIKGLHVGTPKLPAGISIQEFPEIESLAPGESAT 850 860 870 880 890 900 950 960 970 980 990 1000 pF1KE4 VSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNET . :::.::::::.:.:::::. : :.::::::::. :: :::..:::::: : :::: CCDS61 AVMGINFCDSTQAANFQLCTQTRQFYVSIQPPVGELMAPVFMSENEFKKEQGKLMGMNEI 910 920 930 940 950 960 1010 1020 1030 1040 1050 1060 pF1KE4 SAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGS . .. . .. :::. .::.: :: : .. .:::..:. .:::.:.:.. . .. CCDS61 TEKLMLPDTCRSDHIVVQKVTATANLGRVPCGTSDEYRFAGRTLTGGSLVLLTLDARPAG 970 980 990 1000 1010 1020 1070 1080 1090 pF1KE4 TAQLIINTEKTVIGSVLLRELKPVLSQG .::: .:.:: :::..:.... .:.: CCDS61 AAQLTVNSEKMVIGTMLVKDVIQALTQ 1030 1040 1050 >>CCDS45331.1 AP3B2 gene_id:8120|Hs108|chr15 (1082 aa) initn: 4338 init1: 2097 opt: 2189 Z-score: 1249.4 bits: 242.9 E(32554): 2.9e-63 Smith-Waterman score: 4251; 63.1% identity (83.1% similar) in 1100 aa overlap (8-1093:7-1082) 10 20 30 40 50 60 pF1KE4 MSSNSFPYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNEDLKQMLESNKDSAKL :.:..::. . :. . :: :.:::: :...:::.::..:::: :: CCDS45 MSAAPAYSEDKGGSAGP--GEPEYGHDPASG--GIFSSDYKRHDDLKEMLDTNKDSLKL 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 DAMKRIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTF .::::::.:::.:::::.:::::::::: ::::.:::::::::::::::::::::::::: CCDS45 EAMKRIVAMIARGKNASDLFPAVVKNVACKNIEVKKLVYVYLVRYAEEQQDLALLSISTF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 QRALKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSL ::.:::::::::::::::::::::::::::::::::::..:.::::::.::::: ::::: CCDS45 QRGLKDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEAASDMSPYVRKTAAHAIPKLYSL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 DPEQKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDRIDLIHKNYRKLCNLLVDVEEWG : .::..::::::::: ::.::::::::::::::::.::::::::::::::::.:::::: CCDS45 DSDQKDQLIEVIEKLLADKTTLVAGSVVMAFEEVCPERIDLIHKNYRKLCNLLIDVEEWG 180 190 200 210 220 230 250 260 270 280 290 pF1KE4 QVVIIHMLTRYARTQFVSPWKEGDELEDNG-KNFYESDDDQ-----KEKTDK----KKKP ::::: ::::::::::.:: .. . ::.:. : :: :..:. .:.: ..:: CCDS45 QVVIISMLTRYARTQFLSPTQNESLLEENAEKAFYGSEEDEAKGAGSEETAAAAAPSRKP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 YTMDPDHRLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQ :.::::::::.::::::::::.:::::::::::.:..::.:.:.:.:.:::::::. ::: CCDS45 YVMDPDHRLLLRNTKPLLQSRSAAVVMAVAQLYFHLAPKAEVGVIAKALVRLLRSHSEVQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 YIVLQNIATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQ :.::::.:::::.:.:::::::::::.::::::.:: ::::.:::::::.:: :.::::: CCDS45 YVVLQNVATMSIKRRGMFEPYLKSFYIRSTDPTQIKILKLEVLTNLANETNIPTVLREFQ 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 TYVKSQDKQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQ ::..:.::.:.:::::.:::::::: .: :::::::: :::::::.:::::::::::::: CCDS45 TYIRSMDKDFVAATIQAIGRCATNIGRVRDTCLNGLVQLLSNRDELVVAESVVVIKKLLQ 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 MQPAQHGEIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDD ::::::::::::.::: :.: ::.::::::::::: ::.::.::::::::::::::.:.: CCDS45 MQPAQHGEIIKHLAKLTDNIQVPMARASILWLIGEYCEHVPRIAPDVLRKMAKSFTAEED 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE4 LVKLQILNLGAKLYLTNSKQTKLLTQYILNLGKYDQNYDIRDRTRFIRQLIVPNEKSGAL .::::..::.:::::::::::::::::.:.:.:::::::::::.:: ::::::.:..::: CCDS45 IVKLQVINLAAKLYLTNSKQTKLLTQYVLSLAKYDQNYDIRDRARFTRQLIVPSEQGGAL 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE4 SKYAKKIFLAQKPAPLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRN :..:::.::: ::::.::: ::::::::::.::: :: ::::: :: .::: :::::::: CCDS45 SRHAKKLFLAPKPAPVLESSFKDRDHFQLGSLSHLLNAKATGYQELPDWPEEAPDPSVRN 600 610 620 630 640 650 660 670 680 690 700 pF1KE4 VEVIELAKEWTP-AGKAKQENSAKKFYSESEEEEDSSDSS-SDSESESGSESGEQGESGE ::: ::: ... :.... : :::.:: : ..:. :: :::: :.: ..::: CCDS45 VEV----PEWTKCSNREKRKEKEKPFYSDSEGESGPTESADSDPESESESDSKSSSESGS 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE4 EGDSNEDSSEDSSSEQDSESGRESGLENKRTAKRNSKAKGKSDSEDGEKENEKSKTSDSS .:.:...:: ...: :.:: : :... :. :: .. :. . : :: CCDS45 GESSSESDNED--QDEDEEKGR--GSESEQ-----SEEDGKRKTK---KKVPERKGEASS 720 730 740 750 770 780 790 800 810 820 pF1KE4 NDESSSIEDSSSDSESESEPESESESRRVTKEKEKKTKQDRT-PLTKDVSLLDLDDFNPV .::.: ..:::.:::: ::: :. . .. ..: .... : ::..:::::.::.: CCDS45 SDEGS--DSSSSSSESEMTSESEEEQLEPASWSRKTPPSSKSAPATKEISLLDLEDFTPP 760 770 780 790 800 810 830 840 850 860 870 880 pF1KE4 STPVALPTPALSPSLMADLEGLHLSTSSSVISVSTPAFVPTKTHVLLHRMSGKGLAAHYF :. . : .: :: :::::: :. :. : :. .:. . . ::::..:.:::. : CCDS45 SVQPVSPPAIVSTSLAADLEGLTLTDSTLVPSLLSPV-SGVGRQELLHRVAGEGLAVDYT 820 830 840 850 860 870 890 900 910 920 930 940 pF1KE4 FPRQPCIFGD-KMVSIQITLNNTTDRKIENIHIGEKKLPIGMKMHVFNPIDSLEPEGSIT : ::: . :: .:::..: ..:..: :...:.: ::: :.... : :.:: : : : CCDS45 FSRQP-FSGDPHMVSVHIHFSNSSDTPIKGLHVGTPKLPAGISIQEFPEIESLAPGESAT 880 890 900 910 920 930 950 960 970 980 990 1000 pF1KE4 VSMGIDFCDSTQTASFQLCTKDDCFNVNIQPPVGELLLPVAMSEKDFKKEQGVLTGMNET . :::.::::::.:.:::::. : :.::::::::. :: :::..:::::: : :::: CCDS45 AVMGINFCDSTQAANFQLCTQTRQFYVSIQPPVGELMAPVFMSENEFKKEQGKLMGMNEI 940 950 960 970 980 990 1010 1020 1030 1040 1050 1060 pF1KE4 SAVIIAAPQNFTPSVIFQKVVNVANVGAVPSGQDNIHRFAAKTVHSGSLMLVTVELKEGS . .. . .. :::. .::.: :: : .. .:::..:. .:::.:.:.. . .. CCDS45 TEKLMLPDTCRSDHIVVQKVTATANLGRVPCGTSDEYRFAGRTLTGGSLVLLTLDARPAG 1000 1010 1020 1030 1040 1050 1070 1080 1090 pF1KE4 TAQLIINTEKTVIGSVLLRELKPVLSQG .::: .:.:: :::..:.... .:.: CCDS45 AAQLTVNSEKMVIGTMLVKDVIQALTQ 1060 1070 1080 >>CCDS54515.1 AP1B1 gene_id:162|Hs108|chr22 (919 aa) initn: 800 init1: 396 opt: 535 Z-score: 321.2 bits: 70.9 E(32554): 1.4e-11 Smith-Waterman score: 923; 29.0% identity (62.9% similar) in 614 aa overlap (37-635:6-583) 10 20 30 40 50 60 pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK . . ::.: .:: :.:.: : .:.: CCDS54 MTDSKYFTTTKKGEIFELKAELNSDKKEKKKEAVK 10 20 30 70 80 90 100 110 120 pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL .... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:.....:: . CCDS54 KVIASMTVGKDVSALFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNTFVKDC 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPE- .::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... . CCDS54 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQL 100 110 120 130 140 150 190 200 210 220 230 pF1KE4 -QKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDR-----IDLIHKNYRKLCNLLVDVE . . ...... :..:.. .:....: :. :. .. .:: .. :: . : . CCDS54 VEDQGFLDTLKDLISDSNPMVVANAVAALSEIAESHPSSNLLDLNPQSINKLLTALNECT 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH ::::. :. :. :.. .:: . .. .. : . CCDS54 EWGQIFILDCLA----------------------NYMPKDDREAQSICERVTPRLSHANS 220 230 240 250 300 310 320 330 340 350 pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI ... .: :.. . : .: .. . .. .. :: :: .. :.::..:.:: CCDS54 AVVLSAVKVLMKFME----MLSKDLDYYGTLLKK---LAPPLVTLLSAEPELQYVALRNI 260 270 280 290 300 360 370 380 390 400 410 pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD . .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. : CCDS54 NLIVQKRPEILKHEMKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG .:. ....::::: .. . .. :.. :. :.... . :: :..:::: ... : .. CCDS54 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIKDIFRKYPNKYE 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL .: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.::.: CCDS54 SVIATLCENLDSLDEPEARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLQLL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK . .::.: . .:. :.: .:.:. :. : :.::: . .:. . . ::. CCDS54 TAIVKLFLKKPTETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVA------AKE 490 500 510 520 530 600 610 620 630 640 650 pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV . ::.:: . :.: . :. .:::. . . ....: CCDS54 VVLAEKPLISEETDLIEPTLLDELICYIGTLASVYHKPPSAFVEGGRGVVHKSLPPRTAS 540 550 560 570 580 590 660 670 680 690 700 710 pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD CCDS54 SESAESPETAPTGAPPGEQPDVIPAQGDLLGDLLNLDLGPPVSGPPLATSSVQMGAVDLL 600 610 620 630 640 650 >>CCDS13856.2 AP1B1 gene_id:162|Hs108|chr22 (939 aa) initn: 800 init1: 396 opt: 535 Z-score: 321.1 bits: 71.0 E(32554): 1.5e-11 Smith-Waterman score: 923; 29.0% identity (62.9% similar) in 614 aa overlap (37-635:6-583) 10 20 30 40 50 60 pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK . . ::.: .:: :.:.: : .:.: CCDS13 MTDSKYFTTTKKGEIFELKAELNSDKKEKKKEAVK 10 20 30 70 80 90 100 110 120 pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL .... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:.....:: . CCDS13 KVIASMTVGKDVSALFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNTFVKDC 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPE- .::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... . CCDS13 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQL 100 110 120 130 140 150 190 200 210 220 230 pF1KE4 -QKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDR-----IDLIHKNYRKLCNLLVDVE . . ...... :..:.. .:....: :. :. .. .:: .. :: . : . CCDS13 VEDQGFLDTLKDLISDSNPMVVANAVAALSEIAESHPSSNLLDLNPQSINKLLTALNECT 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH ::::. :. :. :.. .:: . .. .. : . CCDS13 EWGQIFILDCLA----------------------NYMPKDDREAQSICERVTPRLSHANS 220 230 240 250 300 310 320 330 340 350 pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI ... .: :.. . : .: .. . .. .. :: :: .. :.::..:.:: CCDS13 AVVLSAVKVLMKFME----MLSKDLDYYGTLLKK---LAPPLVTLLSAEPELQYVALRNI 260 270 280 290 300 360 370 380 390 400 410 pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD . .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. : CCDS13 NLIVQKRPEILKHEMKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG .:. ....::::: .. . .. :.. :. :.... . :: :..:::: ... : .. CCDS13 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIKDIFRKYPNKYE 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL .: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.::.: CCDS13 SVIATLCENLDSLDEPEARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLQLL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK . .::.: . .:. :.: .:.:. :. : :.::: . .:. . . ::. CCDS13 TAIVKLFLKKPTETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVA------AKE 490 500 510 520 530 600 610 620 630 640 650 pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV . ::.:: . :.: . :. .:::. . . ....: CCDS13 VVLAEKPLISEETDLIEPTLLDELICYIGTLASVYHKPPSAFVEGGRGVVHKSLPPRTAS 540 550 560 570 580 590 660 670 680 690 700 710 pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD CCDS13 SESAESPETAPTGAPPGEQPDVIPAQGDLLGDLLNLDLGPPVSGPPLATSSVQMGAVDLL 600 610 620 630 640 650 >>CCDS13855.1 AP1B1 gene_id:162|Hs108|chr22 (949 aa) initn: 800 init1: 396 opt: 535 Z-score: 321.0 bits: 71.0 E(32554): 1.5e-11 Smith-Waterman score: 923; 29.0% identity (62.9% similar) in 614 aa overlap (37-635:6-583) 10 20 30 40 50 60 pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK . . ::.: .:: :.:.: : .:.: CCDS13 MTDSKYFTTTKKGEIFELKAELNSDKKEKKKEAVK 10 20 30 70 80 90 100 110 120 pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL .... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:.....:: . CCDS13 KVIASMTVGKDVSALFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNTFVKDC 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPE- .::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... . CCDS13 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQL 100 110 120 130 140 150 190 200 210 220 230 pF1KE4 -QKEMLIEVIEKLLKDKSTLVAGSVVMAFEEVCPDR-----IDLIHKNYRKLCNLLVDVE . . ...... :..:.. .:....: :. :. .. .:: .. :: . : . CCDS13 VEDQGFLDTLKDLISDSNPMVVANAVAALSEIAESHPSSNLLDLNPQSINKLLTALNECT 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH ::::. :. :. :.. .:: . .. .. : . CCDS13 EWGQIFILDCLA----------------------NYMPKDDREAQSICERVTPRLSHANS 220 230 240 250 300 310 320 330 340 350 pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI ... .: :.. . : .: .. . .. .. :: :: .. :.::..:.:: CCDS13 AVVLSAVKVLMKFME----MLSKDLDYYGTLLKK---LAPPLVTLLSAEPELQYVALRNI 260 270 280 290 300 360 370 380 390 400 410 pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD . .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. : CCDS13 NLIVQKRPEILKHEMKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG .:. ....::::: .. . .. :.. :. :.... . :: :..:::: ... : .. CCDS13 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIKDIFRKYPNKYE 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL .: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.::.: CCDS13 SVIATLCENLDSLDEPEARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLQLL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK . .::.: . .:. :.: .:.:. :. : :.::: . .:. . . ::. CCDS13 TAIVKLFLKKPTETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVA------AKE 490 500 510 520 530 600 610 620 630 640 650 pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV . ::.:: . :.: . :. .:::. . . ....: CCDS13 VVLAEKPLISEETDLIEPTLLDELICYIGTLASVYHKPPSAFVEGGRGVVHKSLPPRTAS 540 550 560 570 580 590 660 670 680 690 700 710 pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD CCDS13 SESAESPETAPTGAPPGEQPDVIPAQGDLLGDLLNLDLGPPVSGPPLATSSVQMGAVDLL 600 610 620 630 640 650 >>CCDS32622.1 AP2B1 gene_id:163|Hs108|chr17 (937 aa) initn: 787 init1: 396 opt: 528 Z-score: 317.1 bits: 70.2 E(32554): 2.4e-11 Smith-Waterman score: 911; 29.0% identity (63.2% similar) in 617 aa overlap (37-638:7-586) 10 20 30 40 50 60 pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK :... ::.: .:: :...: . .:.: CCDS32 MTDSKYFTTN-KKGEIFELKAELNNEKKEKRKEAVK 10 20 30 70 80 90 100 110 120 pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL .... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:......: . CCDS32 KVIAAMTVGKDVSSLFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNSFVKDC 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQ .::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... .. CCDS32 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQM 100 110 120 130 140 150 190 200 210 220 230 pF1KE4 KE--MLIEVIEKLLKDKSTLVAGSVVMAFEEVC---PDR--IDLIHKNYRKLCNLLVDVE : ... .. :. :.. .:....: :. :. :. .:: .: :: . : . CCDS32 VEDQGFLDSLRDLIADSNPMVVANAVAALSEISESHPNSNLLDLNPQNINKLLTALNECT 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH ::::. :. :. : .: .:: . .. .. : . CCDS32 EWGQIFILDCLSNY------NP----------------KDDREAQSICERVTPRLSHANS 220 230 240 250 300 310 320 330 340 350 pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI ... .: :.. . .. . :... :. .. :: :: .. ::::..:.:: CCDS32 AVVLSAVKVLMKFLE---LLPKDSDYYNMLLKK----LAPPLVTLLSGEPEVQYVALRNI 260 270 280 290 300 360 370 380 390 400 410 pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD . .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. : CCDS32 NLIVQKRPEILKQEIKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG .:. ....::::: .. . .. :.. :. :.... . :: :..:::. ... : .. CCDS32 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIRDIFRKYPNKYE 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL :: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.: .: CCDS32 SIIATLCENLDSLDEPDARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLTLL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK . .::.: . ..:. :.: .:.:. :. : :.::: . .:. . . ::. CCDS32 TAIVKLFLKKPSETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVT------AKE 490 500 510 520 530 600 610 620 630 640 650 pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV . :..:: . :.: . :. ..:.:. . . ....: :. CCDS32 VVLSEKPLISEETDLIEPTLLDELICHIGSLASVYHKPPNAFVEGSHGIHRKHLPIHHGS 540 550 560 570 580 590 660 670 680 690 700 710 pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD CCDS32 TDAGDSPVGTTTATNLEQPQVIPSQGDLLGDLLNLDLGPPVNVPQVSSMQMGAVDLLGGG 600 610 620 630 640 650 >>CCDS32621.1 AP2B1 gene_id:163|Hs108|chr17 (951 aa) initn: 787 init1: 396 opt: 528 Z-score: 317.0 bits: 70.2 E(32554): 2.4e-11 Smith-Waterman score: 911; 29.0% identity (63.2% similar) in 617 aa overlap (37-638:7-586) 10 20 30 40 50 60 pF1KE4 PYNEQSGGGEATELGQEATSTISPSGAFGLFSSDLKKNE--DLKQMLESNKDSAKLDAMK :... ::.: .:: :...: . .:.: CCDS32 MTDSKYFTTN-KKGEIFELKAELNNEKKEKRKEAVK 10 20 30 70 80 90 100 110 120 pF1KE4 RIVGMIAKGKNASELFPAVVKNVASKNIEIKKLVYVYLVRYAEEQQDLALLSISTFQRAL .... .. ::..: ::: ::. . . :.:.:::::.::. ::. : :.:......: . CCDS32 KVIAAMTVGKDVSSLFPDVVNCMQTDNLELKKLVYLYLMNYAKSQPDMAIMAVNSFVKDC 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE4 KDPNQLIRASALRVLSSIRVPIIVPIMMLAIKEASADLSPYVRKNAAHAIQKLYSLDPEQ .::: :::: :.:... ::: :. . ... : .:::::.:: . ::.... .. CCDS32 EDPNPLIRALAVRTMGCIRVDKITEYLCEPLRKCLKDEDPYVRKTAAVCVAKLHDINAQM 100 110 120 130 140 150 190 200 210 220 230 pF1KE4 KE--MLIEVIEKLLKDKSTLVAGSVVMAFEEVC---PDR--IDLIHKNYRKLCNLLVDVE : ... .. :. :.. .:....: :. :. :. .:: .: :: . : . CCDS32 VEDQGFLDSLRDLIADSNPMVVANAVAALSEISESHPNSNLLDLNPQNINKLLTALNECT 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 EWGQVVIIHMLTRYARTQFVSPWKEGDELEDNGKNFYESDDDQKEKTDKKKKPYTMDPDH ::::. :. :. : .: .:: . .. .. : . CCDS32 EWGQIFILDCLSNY------NP----------------KDDREAQSICERVTPRLSHANS 220 230 240 250 300 310 320 330 340 350 pF1KE4 RLLIRNTKPLLQSRNAAVVMAVAQLYWHISPKSEAGIISKSLVRLLRSNREVQYIVLQNI ... .: :.. . .. . :... :. .. :: :: .. ::::..:.:: CCDS32 AVVLSAVKVLMKFLE---LLPKDSDYYNMLLKK----LAPPLVTLLSGEPEVQYVALRNI 260 270 280 290 300 360 370 380 390 400 410 pF1KE4 ATMSIQRKGMFEPYLKSFYVRSTDPTMIKTLKLEILTNLANEANISTLLREFQTYVKSQD . .: ... .: :.:. .:: ..: ::.:. ::..:::. .: :.. :. : CCDS32 NLIVQKRPEILKQEIKVFFVKYNDPIYVKLEKLDIMIRLASQANIAQVLAELKEYATEVD 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE4 KQFAAATIQTIGRCATNILEVTDTCLNGLVCLLSNRDEIVVAESVVVIKKLLQMQPAQHG .:. ....::::: .. . .. :.. :. :.... . :: :..:::. ... : .. CCDS32 VDFVRKAVRAIGRCAIKVEQSAERCVSTLLDLIQTKVNYVVQEAIVVIRDIFRKYPNKYE 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE4 EIIKHMAKLLDSITVPVARASILWLIGENCERVPKIAPDVLRKMAKSFTSEDDLVKLQIL :: . . :::. : :::...:..:: ::. . : ..:... ..: .:. :.: .: CCDS32 SIIATLCENLDSLDEPDARAAMIWIVGEYAERIDN-ADELLESFLEGFHDESTQVQLTLL 430 440 450 460 470 480 540 550 560 570 580 590 pF1KE4 NLGAKLYLTNSKQTKLLTQYILNLGKYDQ-NYDIRDRTRFIRQLIVPNEKSGALSKYAKK . .::.: . ..:. :.: .:.:. :. : :.::: . .:. . . ::. CCDS32 TAIVKLFLKKPSETQELVQQVLSLATQDSDNPDLRDRGYIYWRLLSTDPVT------AKE 490 500 510 520 530 600 610 620 630 640 650 pF1KE4 IFLAQKP-----APLLESPFKDRDHFQLGTLSHTLNIKATGYLELSNWPEVAPDPSVRNV . :..:: . :.: . :. ..:.:. . . ....: :. CCDS32 VVLSEKPLISEETDLIEPTLLDELICHIGSLASVYHKPPNAFVEGSHGIHRKHLPIHHGS 540 550 560 570 580 590 660 670 680 690 700 710 pF1KE4 EVIELAKEWTPAGKAKQENSAKKFYSESEEEEDSSDSSSDSESESGSESGEQGESGEEGD CCDS32 TDAGDSPVGTTTATNLEQPQVIPSQGDLLGDLLNLDLGPPVNVPQVSSMQMGAVDLLGGG 600 610 620 630 640 650 1094 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 14:45:45 2016 done: Mon Nov 7 14:45:45 2016 Total Scan time: 4.590 Total Display time: 0.370 Function used was FASTA [36.3.4 Apr, 2011]