FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3655, 1012 aa 1>>>pF1KE3655 1012 - 1012 aa - 1012 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6635+/-0.000872; mu= 19.7504+/- 0.053 mean_var=74.0394+/-14.991, 0's: 0 Z-trim(106.8): 27 B-trim: 0 in 0/52 Lambda= 0.149054 statistics sampled from 9149 (9169) to 9149 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.647), E-opt: 0.2 (0.282), width: 16 Scan time: 4.930 The best scores are: opt bits E(32554) CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012) 6817 1475.9 0 CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058) 2975 649.7 9.2e-186 CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052) 1692 373.8 1e-102 CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 ( 266) 362 87.5 4e-17 CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 ( 299) 362 87.5 4.4e-17 CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 ( 346) 362 87.6 5e-17 CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 ( 449) 354 85.9 2.1e-16 CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 ( 463) 354 85.9 2.1e-16 >>CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012 aa) initn: 6817 init1: 6817 opt: 6817 Z-score: 7913.9 bits: 1475.9 E(32554): 0 Smith-Waterman score: 6817; 100.0% identity (100.0% similar) in 1012 aa overlap (1-1012:1-1012) 10 20 30 40 50 60 pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGVGSLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGVGSLT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 LHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDITEDLLLDFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 LHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDITEDLLLDFQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 VVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 VVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 IQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 IQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 TTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 TTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 QHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 QHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 VAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 VAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 VFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLTVVDMDHIERSNLSRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 VFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLTVVDMDHIERSNLSRQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 FLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 FLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 SFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 SFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 VRYFPSTAEHTLQWARHEFEELFRLSAETINHHQQAHTSLADMDEPQTLTLLKPVLGVLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 VRYFPSTAEHTLQWARHEFEELFRLSAETINHHQQAHTSLADMDEPQTLTLLKPVLGVLR 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 VRPQNWQDCVAWALGHWKLCFHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 VRPQNWQDCVAWALGHWKLCFHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 QDTHLLYVLAAANLYAQMHGLPGSQDWTALRELLKLLPQPDPQQMAPIFASNLELASASA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 QDTHLLYVLAAANLYAQMHGLPGSQDWTALRELLKLLPQPDPQQMAPIFASNLELASASA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 EFGPEQQKELNKALEVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 EFGPEQQKELNKALEVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 QSKRIVGQIIPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 QSKRIVGQIIPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 PAIQTFHHLKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 PAIQTFHHLKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSP 910 920 930 940 950 960 970 980 990 1000 1010 pF1KE3 EKQAQHLPLRVTELVQQLTGQAPAPGQRVLVLELSCEGDDEDTAFPPLHYEL :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS28 EKQAQHLPLRVTELVQQLTGQAPAPGQRVLVLELSCEGDDEDTAFPPLHYEL 970 980 990 1000 1010 >>CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058 aa) initn: 2595 init1: 670 opt: 2975 Z-score: 3448.5 bits: 649.7 E(32554): 9.2e-186 Smith-Waterman score: 2977; 46.7% identity (72.7% similar) in 1019 aa overlap (10-1012:50-1057) 10 20 30 pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSG .:: :::::::::: ::.:.: . ::::: CCDS14 GSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVSG 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE3 LQGLGAEVAKNLVLMGVGSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLN :.:::.:.:::..: :: ..:::: . :.::..:: : :.:. ..:::.:: ::.:: CCDS14 LRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELN 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE3 RAVQVVVHTGDITEDLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLF : :...:: ..::.: ::::::: . ::.::.:: .::..:. ...:::::: :::: CCDS14 SYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLF 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE3 CDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVE :::::.. . : . .::.: .. ... .::..: : : :..::.:.:: ..:::: CCDS14 CDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEAR-HGFESGDFVSFSEVQGMVE 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE3 LNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQ :: .: :.: .. : ::..:: :.::: ...:: :: . ::: ..: .: :. CCDS14 LNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVT 260 270 280 290 300 310 280 290 300 310 320 330 pF1KE3 SSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEE . . . :: .: :::.: :::::.: . :: .:.::. .. :. .. CCDS14 DFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNA--RALPAVQQN 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE3 PLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDG ::: :.: .: .:: :.:. :..:..:::::.:: : ::::. ::::::::.::::: CCDS14 NLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALECLPEDK 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE3 ELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAG :.: . . : : .:::::.::::. .:::: .:.:.::::::::::::: ::..::: : CCDS14 EVL-TEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCG 440 450 460 470 480 490 460 470 480 490 500 510 pF1KE3 NSGGLTVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPT ..: . :.::: ::.:::.:::::: :: . :...::::.: .:: ..: . : CCDS14 EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPD 500 510 520 530 540 550 520 530 540 550 560 570 pF1KE3 TEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVT ::.:: :.::. .:::: :::. .:: :. ::..: :::::.:: :: :.. : .: .: CCDS14 TERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQVVIPFLT 560 570 580 590 600 610 580 590 600 610 620 630 pF1KE3 EAYRAPASAAASEDAP---YPVCTVRYFPSTAEHTLQWARHEFEELFRLSAETINHH--- :.: ..:.: : :.::.. ::.. :::::::: ::: ::. ::..:.. CCDS14 ESY------SSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD 620 630 640 650 660 640 650 660 670 680 690 pF1KE3 -QQAHTSLADMDEPQTLTLLKPVLGVLRV-RPQNWQDCVAWALGHWKLCFHYGIKQLLRH . .. .: . : : .:. : : . :::.: :::.:: ::. . .:.:::.. CCDS14 PKFVERTLR-LAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHN 670 680 690 700 710 720 700 710 720 730 740 750 pF1KE3 FPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHGLPGSQDWTALR :::... .:.:::::::.::.:: ::.:. :: ::.:::::.:: .:: :::: .:. CCDS14 FPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQDRAAVA 730 740 750 760 770 780 760 770 780 790 800 pF1KE3 ELLKLLPQPD--PQQMAPIFASNLELASASAEFGPEQQKELNKALEVWSVGPPLK--PLM .:. . :. :.. . : .:. :: ::.: . .::. .: . : .: :. CCDS14 TFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPID 790 800 810 820 830 840 810 820 830 840 850 860 pF1KE3 FEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQIIPAIATTTAAVAGLLGLE ::::::::::.::.:::..:: .:: :: ..: .:: :.:.::::::::::::.::. :: CCDS14 FEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLE 850 860 870 880 890 900 870 880 890 900 910 920 pF1KE3 LYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFAPAIQTFHHLKWTSWDRLKVPAGQP--- :::::.: : .......:.:: .. :.: . ... .:: :::..: . :: CCDS14 LYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEVQGLQPNGE 910 920 930 940 950 960 930 940 950 960 970 980 pF1KE3 ERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHLPLRVTELVQQLTGQAPA : ::...: ... .: :.. .: .: ..::. : ..: .::.:.... . . CCDS14 EMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLG 970 980 990 1000 1010 1020 990 1000 1010 pF1KE3 PGQRVLVLELSCEGDD-EDTAFPPLHYEL :.::::: :. .. ::. : ..: . CCDS14 RHVRALVLELCCNDESGEDVEVPYVRYTIR 1030 1040 1050 >>CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052 aa) initn: 1537 init1: 366 opt: 1692 Z-score: 1957.5 bits: 373.8 E(32554): 1e-102 Smith-Waterman score: 2037; 37.3% identity (66.1% similar) in 1036 aa overlap (6-1010:35-1045) 10 20 30 pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARV :: .:. ::::: ::::. :::.. ..: CCDS35 EPVAAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHV 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE3 LVSGLQGLGAEVAKNLVLMGVGSLTLHDPHPTC--WSDLAAQFLLSEQDL--ERSRAEAS ..::. ::: :.:::::: :. ..:.:: . : : ::...:.:::.:. .:.:::: CCDS35 FLSGMGGLGLEIAKNLVLAGIKAVTIHDTEK-CQAW-DLGTNFFLSEDDVVNKRNRAEAV 70 80 90 100 110 120 100 110 120 130 140 pF1KE3 QELLAQLNRAVQVVVHTGDITE--DL-LLD-FQVVVLTAAKLEEQLKVGTLCHKH--GVC . .:.:: :.:. . ..: :: .:: .: :::: :: : :.. .:... . CCDS35 LKHIAELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIK 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE3 FLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRD :..::..:. ..::::::..: : : : :: :..:.:..:::.: .. . : .. CCDS35 FISADVHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLEN-HPHKLET 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE3 GDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHK :...:: :.::. :: . ..: : :. ::::: . ::.:: ..:: :::: . CCDS35 GQFLTFREINGMTGLNG-SIQQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFE 250 260 270 280 290 300 270 280 290 300 310 320 pF1KE3 SLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARD ::. : .:. . . .. . .: :. :: .::. ..: :. :.: .. :: . CCDS35 SLERQLKHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATS 310 320 330 340 350 360 330 340 350 360 370 380 pF1KE3 LEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQ . . ::.: .. .:. .. .. : :::..: .:.::.::::::.. :: :: : CCDS35 IS--ETLEEKP---DVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQ 370 380 390 400 410 390 400 410 420 430 440 pF1KE3 WLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGC :::..: : . :. : :. ::.:::. : .: . .::. . .::: ::::: CCDS35 WLYLEAADIVESLGK--PECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGC 420 430 440 450 460 470 450 460 470 480 490 500 pF1KE3 ELLKVFALVGLGAGNSGGL-TVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLN :.:: :::.:.:... :. ::.: : ::.:::.:::::: . . .::. .:: :. .: CCDS35 EMLKNFALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKIN 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE3 PDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGT .... . :::: ::.:.:... : . .:::. .::::: .:: :.:::..:: CCDS35 SQIKIDAHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGT 540 550 560 570 580 590 570 580 590 600 610 620 pF1KE3 SGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHTLQWARHEFEELFR :: : . :..::.::.: . . : : ::.. ::.. :::.:::: .:: : CCDS35 MGTKGHTEVIVPHLTESYNSHRDPPEEE---IPFCTLKSFPAAIEHTIQWARDKFESSFS 600 610 620 630 640 650 630 640 650 660 670 680 pF1KE3 LSAETINHHQQAHTS----LADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLC . .:. :...: : .. ..: :. .: ::.::..:: : ... CCDS35 HKPSLFNKFWQTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKY 660 670 680 690 700 710 690 700 710 720 730 740 pF1KE3 FHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHG :.. :::. :: . :.::. ::..::. :.:..:: :. :: .. ::.::: .. CCDS35 FNHKALQLLHCFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYC 720 730 740 750 760 770 750 760 770 780 790 pF1KE3 LPGSQDWTALRELLKLLPQPDPQQMAP----IFASNLELASASAEFGPEQQK----ELNK .: ... . ::..: . :.. : . ... . .. :... .:.: CCDS35 IPFAEEDLSADALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDERNAIFQLEK 780 790 800 810 820 830 800 810 820 830 840 pF1KE3 AL---EVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQI :. :. . . : :::::: : :.::..::..:: . :.: :..: ..:::.:.: CCDS35 AILSNEATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKI 840 850 860 870 880 890 850 860 870 880 890 900 pF1KE3 IPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFAPAIQT--FH :::::::::.:.::..::. :: .: : :... .:.:: .. . . . .: . CCDS35 IPAIATTTATVSGLVALEMIKV-TGGYPFEAYKNCFLNLAIPIVV-FTETTEVRKTKIRN 900 910 920 930 940 910 920 930 940 950 960 pF1KE3 HLKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHL ...: ::: : :. . :: ... ..:..:.. ....: .::. : .:..: CCDS35 GISFTIWDRWTVH-GKEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVM-P-GHAKRL 950 960 970 980 990 1000 970 980 990 1000 1010 pF1KE3 PLRVTELVQQLTGQAPAPGQRVLVLELSCEGD---DEDTAFPPLHYEL : . .::. :. .. . : .: : ::: ::..: CCDS35 KLTMHKLVK------PTTEKKYVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD 1010 1020 1030 1040 1050 >>CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 (266 aa) initn: 351 init1: 255 opt: 362 Z-score: 420.9 bits: 87.5 E(32554): 4e-17 Smith-Waterman score: 362; 38.0% identity (68.4% similar) in 171 aa overlap (15-182:19-189) 10 20 30 40 50 pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGV :.::. . : :..:....:::. ::.:::::.::::.: :: CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLVGLKGLGAEIAKNLILAGV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 GSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDIT---E .::. : . . : .::::. .. :.::::: : .:: :.: : : :: : CCDS54 KGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLERAQNLNPMVDVKVDTEDIEKKPE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 DLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTE ... .:..: :: . . .:: .:::... :...:. : : : ..:: :.. :. CCDS54 SFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDVFGYHGYTFANLGEHEFVEEKTK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 AEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVRED . .. ... CCDS54 VAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFCPVKEALEVDWSSEKAKAALKRTTSDY 190 200 210 220 230 240 >>CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 (299 aa) initn: 351 init1: 255 opt: 362 Z-score: 420.1 bits: 87.5 E(32554): 4.4e-17 Smith-Waterman score: 362; 38.0% identity (68.4% similar) in 171 aa overlap (15-182:19-189) 10 20 30 40 50 pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGV :.::. . : :..:....:::. ::.:::::.::::.: :: CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLVGLKGLGAEIAKNLILAGV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 GSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDIT---E .::. : . . : .::::. .. :.::::: : .:: :.: : : :: : CCDS54 KGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLERAQNLNPMVDVKVDTEDIEKKPE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 DLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTE ... .:..: :: . . .:: .:::... :...:. : : : ..:: :.. :. CCDS54 SFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDVFGYHGYTFANLGEHEFVEEKTK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 AEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVRED . .. ... CCDS54 VAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFCPVKEALEVDWSSEKAKAALKRTTSDY 190 200 210 220 230 240 >>CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 (346 aa) initn: 408 init1: 255 opt: 362 Z-score: 419.1 bits: 87.6 E(32554): 5e-17 Smith-Waterman score: 372; 30.2% identity (56.5% similar) in 384 aa overlap (15-392:19-334) 10 20 30 40 50 pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGV :.::. . : :..:....:::. ::.:::::.::::.: :: CCDS12 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLVGLKGLGAEIAKNLILAGV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 GSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDIT---E .::. : . . : .::::. .. :.::::: : .:: :.: : : :: : CCDS12 KGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLERAQNLNPMVDVKVDTEDIEKKPE 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 DLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTE ... .:..: :: . . .:: .:::... :...:. : : : ..:: :.. :. CCDS12 SFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDVFGYHGYTFANLGEHEFVEEKTK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 AEPLTAAIQHISQGSPGILTLRKGANTHYFR-DGDLVTFSGIEGMVELNDCDPRSIHVRE . ..::: .. : .:. . :.. .:. .. : . : : :.: CCDS12 -------VAKVSQG------VEDGPDTKRAKLDSSETTM--VKKKVVF--C-P----VKE 190 200 210 240 250 260 270 280 290 pF1KE3 DGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQSSQEVHHAHCLHQ .::. : .. . : . .:: . : ::: CCDS12 --ALEV-DWSSEK------AKAALKRTTS------DYFLLQ------------------- 220 230 240 300 310 320 330 340 350 pF1KE3 AFCALHKFQHLHGRPPQPWDPV--DAETVVGLARDLEPLKRTEEEPLEEPLDEALVRTVA .: ::. .:: :. : :.: .. . :. : : . : : .:: CCDS12 ---VLLKFRTDKGRDPSS-DTYEEDSELLLQIRNDV--LDSLGISP--DLLPEDFVR-YC 250 260 270 280 290 360 370 380 390 400 410 pF1KE3 LSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDGELLPSPEDCAL .: ..:. :..:.. :::..::.:.. : .....::.. CCDS12 FSE---MAPVCAVVGGILAQEIVKALSQRDPPHNNFFFFDGMKGNGIVECLGPK 300 310 320 330 340 420 430 440 450 460 470 pF1KE3 RGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLTVVDMD >>CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 (449 aa) initn: 241 init1: 179 opt: 354 Z-score: 408.1 bits: 85.9 E(32554): 2.1e-16 Smith-Waterman score: 357; 33.5% identity (56.9% similar) in 218 aa overlap (436-634:59-265) 410 420 430 440 450 460 pF1KE3 EDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLT :..:::..:::::: .:: :. . CCDS29 KFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGFRQ-----IH 30 40 50 60 70 80 470 480 490 500 510 520 pF1KE3 VVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYG :.::: :. :::.:::::: .:.::::::::: :. .:.: .. .. CCDS29 VIDMDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQD-----FN 90 100 110 120 130 530 540 550 560 570 pF1KE3 DNFFSRVDGVAAALDSFQARRYVAARCTHYLK------------PLLEAGTSGTWGSATV :.:. . .. .:::. :::.. . :. ::...:: : :.: : CCDS29 DTFYRQFHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEGFKGNARV 140 150 160 170 180 190 580 590 600 610 620 pF1KE3 FMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHT------LQWARHE-FEELFRLS ..: .: . . . .:.::. .: :: ::: ... : : :. CCDS29 ILPGMTACIECTLELYPPQ-VNFPMCTIASMPRLPEHCIEYVRMLQWPKEQPFGEGVPLD 200 210 220 230 240 250 630 640 650 660 670 680 pF1KE3 AETINHHQQAHTSLADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLCFHYGIK .. .: : CCDS29 GDDPEHIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCATEVFKI 260 270 280 290 300 310 >>CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 (463 aa) initn: 241 init1: 179 opt: 354 Z-score: 407.9 bits: 85.9 E(32554): 2.1e-16 Smith-Waterman score: 357; 33.5% identity (56.9% similar) in 218 aa overlap (436-634:73-279) 410 420 430 440 450 460 pF1KE3 EDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLT :..:::..:::::: .:: :. . CCDS29 KFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGFRQ-----IH 50 60 70 80 90 470 480 490 500 510 520 pF1KE3 VVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYG :.::: :. :::.:::::: .:.::::::::: :. .:.: .. .. CCDS29 VIDMDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQD-----FN 100 110 120 130 140 150 530 540 550 560 570 pF1KE3 DNFFSRVDGVAAALDSFQARRYVAARCTHYLK------------PLLEAGTSGTWGSATV :.:. . .. .:::. :::.. . :. ::...:: : :.: : CCDS29 DTFYRQFHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEGFKGNARV 160 170 180 190 200 210 580 590 600 610 620 pF1KE3 FMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHT------LQWARHE-FEELFRLS ..: .: . . . .:.::. .: :: ::: ... : : :. CCDS29 ILPGMTACIECTLELYPPQ-VNFPMCTIASMPRLPEHCIEYVRMLQWPKEQPFGEGVPLD 220 230 240 250 260 270 630 640 650 660 670 680 pF1KE3 AETINHHQQAHTSLADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLCFHYGIK .. .: : CCDS29 GDDPEHIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCATEVFKI 280 290 300 310 320 330 1012 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 20:23:54 2016 done: Sun Nov 6 20:23:55 2016 Total Scan time: 4.930 Total Display time: 0.180 Function used was FASTA [36.3.4 Apr, 2011]