FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3655, 1012 aa
1>>>pF1KE3655 1012 - 1012 aa - 1012 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6635+/-0.000872; mu= 19.7504+/- 0.053
mean_var=74.0394+/-14.991, 0's: 0 Z-trim(106.8): 27 B-trim: 0 in 0/52
Lambda= 0.149054
statistics sampled from 9149 (9169) to 9149 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.647), E-opt: 0.2 (0.282), width: 16
Scan time: 4.930
The best scores are: opt bits E(32554)
CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012) 6817 1475.9 0
CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058) 2975 649.7 9.2e-186
CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052) 1692 373.8 1e-102
CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 ( 266) 362 87.5 4e-17
CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 ( 299) 362 87.5 4.4e-17
CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 ( 346) 362 87.6 5e-17
CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 ( 449) 354 85.9 2.1e-16
CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 ( 463) 354 85.9 2.1e-16
>>CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012 aa)
initn: 6817 init1: 6817 opt: 6817 Z-score: 7913.9 bits: 1475.9 E(32554): 0
Smith-Waterman score: 6817; 100.0% identity (100.0% similar) in 1012 aa overlap (1-1012:1-1012)
10 20 30 40 50 60
pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGVGSLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGVGSLT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 LHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDITEDLLLDFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 LHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDITEDLLLDFQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 VVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 VVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 IQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 IQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 TTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 TTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 QHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 QHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 VAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 VAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 VFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLTVVDMDHIERSNLSRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 VFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLTVVDMDHIERSNLSRQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 FLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 FLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 SFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 SFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 VRYFPSTAEHTLQWARHEFEELFRLSAETINHHQQAHTSLADMDEPQTLTLLKPVLGVLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 VRYFPSTAEHTLQWARHEFEELFRLSAETINHHQQAHTSLADMDEPQTLTLLKPVLGVLR
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 VRPQNWQDCVAWALGHWKLCFHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 VRPQNWQDCVAWALGHWKLCFHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 QDTHLLYVLAAANLYAQMHGLPGSQDWTALRELLKLLPQPDPQQMAPIFASNLELASASA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 QDTHLLYVLAAANLYAQMHGLPGSQDWTALRELLKLLPQPDPQQMAPIFASNLELASASA
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 EFGPEQQKELNKALEVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 EFGPEQQKELNKALEVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 QSKRIVGQIIPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 QSKRIVGQIIPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 PAIQTFHHLKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 PAIQTFHHLKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSP
910 920 930 940 950 960
970 980 990 1000 1010
pF1KE3 EKQAQHLPLRVTELVQQLTGQAPAPGQRVLVLELSCEGDDEDTAFPPLHYEL
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 EKQAQHLPLRVTELVQQLTGQAPAPGQRVLVLELSCEGDDEDTAFPPLHYEL
970 980 990 1000 1010
>>CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058 aa)
initn: 2595 init1: 670 opt: 2975 Z-score: 3448.5 bits: 649.7 E(32554): 9.2e-186
Smith-Waterman score: 2977; 46.7% identity (72.7% similar) in 1019 aa overlap (10-1012:50-1057)
10 20 30
pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSG
.:: :::::::::: ::.:.: . :::::
CCDS14 GSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVSG
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE3 LQGLGAEVAKNLVLMGVGSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLN
:.:::.:.:::..: :: ..:::: . :.::..:: : :.:. ..:::.:: ::.::
CCDS14 LRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELN
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE3 RAVQVVVHTGDITEDLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLF
: :...:: ..::.: ::::::: . ::.::.:: .::..:. ...:::::: ::::
CCDS14 SYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLF
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE3 CDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVE
:::::.. . : . .::.: .. ... .::..: : : :..::.:.:: ..::::
CCDS14 CDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEAR-HGFESGDFVSFSEVQGMVE
200 210 220 230 240 250
220 230 240 250 260 270
pF1KE3 LNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQ
:: .: :.: .. : ::..:: :.::: ...:: :: . ::: ..: .: :.
CCDS14 LNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVT
260 270 280 290 300 310
280 290 300 310 320 330
pF1KE3 SSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEE
. . . :: .: :::.: :::::.: . :: .:.::. .. :. ..
CCDS14 DFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNA--RALPAVQQN
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE3 PLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDG
::: :.: .: .:: :.:. :..:..:::::.:: : ::::. ::::::::.:::::
CCDS14 NLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALECLPEDK
380 390 400 410 420 430
400 410 420 430 440 450
pF1KE3 ELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAG
:.: . . : : .:::::.::::. .:::: .:.:.::::::::::::: ::..::: :
CCDS14 EVL-TEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCG
440 450 460 470 480 490
460 470 480 490 500 510
pF1KE3 NSGGLTVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPT
..: . :.::: ::.:::.:::::: :: . :...::::.: .:: ..: . :
CCDS14 EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPD
500 510 520 530 540 550
520 530 540 550 560 570
pF1KE3 TEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVT
::.:: :.::. .:::: :::. .:: :. ::..: :::::.:: :: :.. : .: .:
CCDS14 TERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQVVIPFLT
560 570 580 590 600 610
580 590 600 610 620 630
pF1KE3 EAYRAPASAAASEDAP---YPVCTVRYFPSTAEHTLQWARHEFEELFRLSAETINHH---
:.: ..:.: : :.::.. ::.. :::::::: ::: ::. ::..:..
CCDS14 ESY------SSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD
620 630 640 650 660
640 650 660 670 680 690
pF1KE3 -QQAHTSLADMDEPQTLTLLKPVLGVLRV-RPQNWQDCVAWALGHWKLCFHYGIKQLLRH
. .. .: . : : .:. : : . :::.: :::.:: ::. . .:.:::..
CCDS14 PKFVERTLR-LAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHN
670 680 690 700 710 720
700 710 720 730 740 750
pF1KE3 FPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHGLPGSQDWTALR
:::... .:.:::::::.::.:: ::.:. :: ::.:::::.:: .:: :::: .:.
CCDS14 FPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQDRAAVA
730 740 750 760 770 780
760 770 780 790 800
pF1KE3 ELLKLLPQPD--PQQMAPIFASNLELASASAEFGPEQQKELNKALEVWSVGPPLK--PLM
.:. . :. :.. . : .:. :: ::.: . .::. .: . : .: :.
CCDS14 TFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPID
790 800 810 820 830 840
810 820 830 840 850 860
pF1KE3 FEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQIIPAIATTTAAVAGLLGLE
::::::::::.::.:::..:: .:: :: ..: .:: :.:.::::::::::::.::. ::
CCDS14 FEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLE
850 860 870 880 890 900
870 880 890 900 910 920
pF1KE3 LYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFAPAIQTFHHLKWTSWDRLKVPAGQP---
:::::.: : .......:.:: .. :.: . ... .:: :::..: . ::
CCDS14 LYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEVQGLQPNGE
910 920 930 940 950 960
930 940 950 960 970 980
pF1KE3 ERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHLPLRVTELVQQLTGQAPA
: ::...: ... .: :.. .: .: ..::. : ..: .::.:.... . .
CCDS14 EMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLG
970 980 990 1000 1010 1020
990 1000 1010
pF1KE3 PGQRVLVLELSCEGDD-EDTAFPPLHYEL
:.::::: :. .. ::. : ..: .
CCDS14 RHVRALVLELCCNDESGEDVEVPYVRYTIR
1030 1040 1050
>>CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052 aa)
initn: 1537 init1: 366 opt: 1692 Z-score: 1957.5 bits: 373.8 E(32554): 1e-102
Smith-Waterman score: 2037; 37.3% identity (66.1% similar) in 1036 aa overlap (6-1010:35-1045)
10 20 30
pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARV
:: .:. ::::: ::::. :::.. ..:
CCDS35 EPVAAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHV
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE3 LVSGLQGLGAEVAKNLVLMGVGSLTLHDPHPTC--WSDLAAQFLLSEQDL--ERSRAEAS
..::. ::: :.:::::: :. ..:.:: . : : ::...:.:::.:. .:.::::
CCDS35 FLSGMGGLGLEIAKNLVLAGIKAVTIHDTEK-CQAW-DLGTNFFLSEDDVVNKRNRAEAV
70 80 90 100 110 120
100 110 120 130 140
pF1KE3 QELLAQLNRAVQVVVHTGDITE--DL-LLD-FQVVVLTAAKLEEQLKVGTLCHKH--GVC
. .:.:: :.:. . ..: :: .:: .: :::: :: : :.. .:... .
CCDS35 LKHIAELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIK
130 140 150 160 170 180
150 160 170 180 190 200
pF1KE3 FLAADTRGLVGQLFCDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRD
:..::..:. ..::::::..: : : : :: :..:.:..:::.: .. . : ..
CCDS35 FISADVHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLEN-HPHKLET
190 200 210 220 230 240
210 220 230 240 250 260
pF1KE3 GDLVTFSGIEGMVELNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHK
:...:: :.::. :: . ..: : :. ::::: . ::.:: ..:: :::: .
CCDS35 GQFLTFREINGMTGLNG-SIQQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFE
250 260 270 280 290 300
270 280 290 300 310 320
pF1KE3 SLDTALLQPHVVAQSSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARD
::. : .:. . . .. . .: :. :: .::. ..: :. :.: .. :: .
CCDS35 SLERQLKHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATS
310 320 330 340 350 360
330 340 350 360 370 380
pF1KE3 LEPLKRTEEEPLEEPLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQ
. . ::.: .. .:. .. .. : :::..: .:.::.::::::.. :: :: :
CCDS35 IS--ETLEEKP---DVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQ
370 380 390 400 410
390 400 410 420 430 440
pF1KE3 WLYFDALDCLPEDGELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGC
:::..: : . :. : :. ::.:::. : .: . .::. . .::: :::::
CCDS35 WLYLEAADIVESLGK--PECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGC
420 430 440 450 460 470
450 460 470 480 490 500
pF1KE3 ELLKVFALVGLGAGNSGGL-TVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLN
:.:: :::.:.:... :. ::.: : ::.:::.:::::: . . .::. .:: :. .:
CCDS35 EMLKNFALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKIN
480 490 500 510 520 530
510 520 530 540 550 560
pF1KE3 PDLQVIPLTYPLDPTTEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGT
.... . :::: ::.:.:... : . .:::. .::::: .:: :.:::..::
CCDS35 SQIKIDAHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGT
540 550 560 570 580 590
570 580 590 600 610 620
pF1KE3 SGTWGSATVFMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHTLQWARHEFEELFR
:: : . :..::.::.: . . : : ::.. ::.. :::.:::: .:: :
CCDS35 MGTKGHTEVIVPHLTESYNSHRDPPEEE---IPFCTLKSFPAAIEHTIQWARDKFESSFS
600 610 620 630 640 650
630 640 650 660 670 680
pF1KE3 LSAETINHHQQAHTS----LADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLC
. .:. :...: : .. ..: :. .: ::.::..:: : ...
CCDS35 HKPSLFNKFWQTYSSAEEVLQKIQSGHSLEGCFQVIKLLSRRPRNWSQCVELARLKFEKY
660 670 680 690 700 710
690 700 710 720 730 740
pF1KE3 FHYGIKQLLRHFPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHG
:.. :::. :: . :.::. ::..::. :.:..:: :. :: .. ::.::: ..
CCDS35 FNHKALQLLHCFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYC
720 730 740 750 760 770
750 760 770 780 790
pF1KE3 LPGSQDWTALRELLKLLPQPDPQQMAP----IFASNLELASASAEFGPEQQK----ELNK
.: ... . ::..: . :.. : . ... . .. :... .:.:
CCDS35 IPFAEEDLSADALLNILSEVKIQEFKPSNKVVQTDETARKPDHVPISSEDERNAIFQLEK
780 790 800 810 820 830
800 810 820 830 840
pF1KE3 AL---EVWSVGPPLKPLMFEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQI
:. :. . . : :::::: : :.::..::..:: . :.: :..: ..:::.:.:
CCDS35 AILSNEATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKI
840 850 860 870 880 890
850 860 870 880 890 900
pF1KE3 IPAIATTTAAVAGLLGLELYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFAPAIQT--FH
:::::::::.:.::..::. :: .: : :... .:.:: .. . . . .: .
CCDS35 IPAIATTTATVSGLVALEMIKV-TGGYPFEAYKNCFLNLAIPIVV-FTETTEVRKTKIRN
900 910 920 930 940
910 920 930 940 950 960
pF1KE3 HLKWTSWDRLKVPAGQPERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHL
...: ::: : :. . :: ... ..:..:.. ....: .::. : .:..:
CCDS35 GISFTIWDRWTVH-GKEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVM-P-GHAKRL
950 960 970 980 990 1000
970 980 990 1000 1010
pF1KE3 PLRVTELVQQLTGQAPAPGQRVLVLELSCEGD---DEDTAFPPLHYEL
: . .::. :. .. . : .: : ::: ::..:
CCDS35 KLTMHKLVK------PTTEKKYVDLTVSFAPDIDGDEDLPGPPVRYYFSHDTD
1010 1020 1030 1040 1050
>>CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 (266 aa)
initn: 351 init1: 255 opt: 362 Z-score: 420.9 bits: 87.5 E(32554): 4e-17
Smith-Waterman score: 362; 38.0% identity (68.4% similar) in 171 aa overlap (15-182:19-189)
10 20 30 40 50
pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGV
:.::. . : :..:....:::. ::.:::::.::::.: ::
CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLVGLKGLGAEIAKNLILAGV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 GSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDIT---E
.::. : . . : .::::. .. :.::::: : .:: :.: : : :: :
CCDS54 KGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLERAQNLNPMVDVKVDTEDIEKKPE
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 DLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTE
... .:..: :: . . .:: .:::... :...:. : : : ..:: :.. :.
CCDS54 SFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDVFGYHGYTFANLGEHEFVEEKTK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 AEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVRED
. .. ...
CCDS54 VAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFCPVKEALEVDWSSEKAKAALKRTTSDY
190 200 210 220 230 240
>>CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 (299 aa)
initn: 351 init1: 255 opt: 362 Z-score: 420.1 bits: 87.5 E(32554): 4.4e-17
Smith-Waterman score: 362; 38.0% identity (68.4% similar) in 171 aa overlap (15-182:19-189)
10 20 30 40 50
pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGV
:.::. . : :..:....:::. ::.:::::.::::.: ::
CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLVGLKGLGAEIAKNLILAGV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 GSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDIT---E
.::. : . . : .::::. .. :.::::: : .:: :.: : : :: :
CCDS54 KGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLERAQNLNPMVDVKVDTEDIEKKPE
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 DLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTE
... .:..: :: . . .:: .:::... :...:. : : : ..:: :.. :.
CCDS54 SFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDVFGYHGYTFANLGEHEFVEEKTK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 AEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVELNDCDPRSIHVRED
. .. ...
CCDS54 VAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFCPVKEALEVDWSSEKAKAALKRTTSDY
190 200 210 220 230 240
>>CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 (346 aa)
initn: 408 init1: 255 opt: 362 Z-score: 419.1 bits: 87.6 E(32554): 5e-17
Smith-Waterman score: 372; 30.2% identity (56.5% similar) in 384 aa overlap (15-392:19-334)
10 20 30 40 50
pF1KE3 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSGLQGLGAEVAKNLVLMGV
:.::. . : :..:....:::. ::.:::::.::::.: ::
CCDS12 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASRVLLVGLKGLGAEIAKNLILAGV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 GSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLNRAVQVVVHTGDIT---E
.::. : . . : .::::. .. :.::::: : .:: :.: : : :: :
CCDS12 KGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLERAQNLNPMVDVKVDTEDIEKKPE
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 DLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLFCDFGEDFTVQDPTE
... .:..: :: . . .:: .:::... :...:. : : : ..:: :.. :.
CCDS12 SFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDVFGYHGYTFANLGEHEFVEEKTK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 AEPLTAAIQHISQGSPGILTLRKGANTHYFR-DGDLVTFSGIEGMVELNDCDPRSIHVRE
. ..::: .. : .:. . :.. .:. .. : . : : :.:
CCDS12 -------VAKVSQG------VEDGPDTKRAKLDSSETTM--VKKKVVF--C-P----VKE
190 200 210
240 250 260 270 280 290
pF1KE3 DGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQSSQEVHHAHCLHQ
.::. : .. . : . .:: . : :::
CCDS12 --ALEV-DWSSEK------AKAALKRTTS------DYFLLQ-------------------
220 230 240
300 310 320 330 340 350
pF1KE3 AFCALHKFQHLHGRPPQPWDPV--DAETVVGLARDLEPLKRTEEEPLEEPLDEALVRTVA
.: ::. .:: :. : :.: .. . :. : : . : : .::
CCDS12 ---VLLKFRTDKGRDPSS-DTYEEDSELLLQIRNDV--LDSLGISP--DLLPEDFVR-YC
250 260 270 280 290
360 370 380 390 400 410
pF1KE3 LSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDGELLPSPEDCAL
.: ..:. :..:.. :::..::.:.. : .....::..
CCDS12 FSE---MAPVCAVVGGILAQEIVKALSQRDPPHNNFFFFDGMKGNGIVECLGPK
300 310 320 330 340
420 430 440 450 460 470
pF1KE3 RGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLTVVDMD
>>CCDS2910.1 UBA3 gene_id:9039|Hs108|chr3 (449 aa)
initn: 241 init1: 179 opt: 354 Z-score: 408.1 bits: 85.9 E(32554): 2.1e-16
Smith-Waterman score: 357; 33.5% identity (56.9% similar) in 218 aa overlap (436-634:59-265)
410 420 430 440 450 460
pF1KE3 EDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLT
:..:::..:::::: .:: :. .
CCDS29 KFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGFRQ-----IH
30 40 50 60 70 80
470 480 490 500 510 520
pF1KE3 VVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYG
:.::: :. :::.:::::: .:.::::::::: :. .:.: .. ..
CCDS29 VIDMDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQD-----FN
90 100 110 120 130
530 540 550 560 570
pF1KE3 DNFFSRVDGVAAALDSFQARRYVAARCTHYLK------------PLLEAGTSGTWGSATV
:.:. . .. .:::. :::.. . :. ::...:: : :.: :
CCDS29 DTFYRQFHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEGFKGNARV
140 150 160 170 180 190
580 590 600 610 620
pF1KE3 FMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHT------LQWARHE-FEELFRLS
..: .: . . . .:.::. .: :: ::: ... : : :.
CCDS29 ILPGMTACIECTLELYPPQ-VNFPMCTIASMPRLPEHCIEYVRMLQWPKEQPFGEGVPLD
200 210 220 230 240 250
630 640 650 660 670 680
pF1KE3 AETINHHQQAHTSLADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLCFHYGIK
.. .: :
CCDS29 GDDPEHIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCATEVFKI
260 270 280 290 300 310
>>CCDS2909.1 UBA3 gene_id:9039|Hs108|chr3 (463 aa)
initn: 241 init1: 179 opt: 354 Z-score: 407.9 bits: 85.9 E(32554): 2.1e-16
Smith-Waterman score: 357; 33.5% identity (56.9% similar) in 218 aa overlap (436-634:73-279)
410 420 430 440 450 460
pF1KE3 EDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAGNSGGLT
:..:::..:::::: .:: :. .
CCDS29 KFLERSGPFTHPDFEPSTESLQFLLDTCKVLVIGAGGLGCELLKNLALSGFRQ-----IH
50 60 70 80 90
470 480 490 500 510 520
pF1KE3 VVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPTTEHIYG
:.::: :. :::.:::::: .:.::::::::: :. .:.: .. ..
CCDS29 VIDMDTIDVSNLNRQFLFRPKDIGRPKAEVAAEFLNDRVPNCNVVPHFNKIQD-----FN
100 110 120 130 140 150
530 540 550 560 570
pF1KE3 DNFFSRVDGVAAALDSFQARRYVAARCTHYLK------------PLLEAGTSGTWGSATV
:.:. . .. .:::. :::.. . :. ::...:: : :.: :
CCDS29 DTFYRQFHIIVCGLDSIIARRWINGMLISLLNYEDGVLDPSSIVPLIDGGTEGFKGNARV
160 170 180 190 200 210
580 590 600 610 620
pF1KE3 FMPHVTEAYRAPASAAASEDAPYPVCTVRYFPSTAEHT------LQWARHE-FEELFRLS
..: .: . . . .:.::. .: :: ::: ... : : :.
CCDS29 ILPGMTACIECTLELYPPQ-VNFPMCTIASMPRLPEHCIEYVRMLQWPKEQPFGEGVPLD
220 230 240 250 260 270
630 640 650 660 670 680
pF1KE3 AETINHHQQAHTSLADMDEPQTLTLLKPVLGVLRVRPQNWQDCVAWALGHWKLCFHYGIK
.. .: :
CCDS29 GDDPEHIQWIFQKSLERASQYNIRGVTYRLTQGVVKRIIPAVASTNAVIAAVCATEVFKI
280 290 300 310 320 330
1012 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 20:23:54 2016 done: Sun Nov 6 20:23:55 2016
Total Scan time: 4.930 Total Display time: 0.180
Function used was FASTA [36.3.4 Apr, 2011]