FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4151, 1058 aa
1>>>pF1KB4151 1058 - 1058 aa - 1058 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8823+/-0.00104; mu= 18.8313+/- 0.063
mean_var=74.6021+/-14.841, 0's: 0 Z-trim(104.3): 30 B-trim: 0 in 0/50
Lambda= 0.148490
statistics sampled from 7815 (7833) to 7815 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.605), E-opt: 0.2 (0.241), width: 16
Scan time: 4.640
The best scores are: opt bits E(32554)
CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058) 7085 1528.0 0
CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012) 2975 647.5 4.3e-185
CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052) 2606 568.4 2.8e-161
CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 ( 640) 445 105.4 4.1e-22
CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 ( 266) 363 87.7 3.7e-17
CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 ( 299) 363 87.7 4.1e-17
CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 ( 346) 363 87.7 4.6e-17
>>CCDS14275.1 UBA1 gene_id:7317|Hs108|chrX (1058 aa)
initn: 7085 init1: 7085 opt: 7085 Z-score: 8194.7 bits: 1528.0 E(32554): 0
Smith-Waterman score: 7085; 100.0% identity (100.0% similar) in 1058 aa overlap (1-1058:1-1058)
10 20 30 40 50 60
pF1KB4 MSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MSSSPLSKKRRVSGPDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 VLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VLGHEAMKRLQTSSVLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLRE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 EDIGKNRAEVSQPRLAELNSYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 EDIGKNRAEVSQPRLAELNSYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 NRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NRGIKLVVADTRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 GFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GFESGDFVSFSEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 ISFKSLVASLAEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ISFKSLVASLAEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 LAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LAQAVNARALPAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 MQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MQWLYFDALECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 CELLKNFAMIGLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CELLKNFAMIGLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 PHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PHIRVTSHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 LGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LGTKGNVQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPA
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 ENVNQYLTDPKFVERTLRLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ENVNQYLTDPKFVERTLRLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 NIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NIRQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 SQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SQDRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 QGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 QGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVS
970 980 990 1000 1010 1020
1030 1040 1050
pF1KB4 RVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR
::::::::::::::::::::::::::::::::::::::
CCDS14 RVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR
1030 1040 1050
>>CCDS2805.1 UBA7 gene_id:7318|Hs108|chr3 (1012 aa)
initn: 2595 init1: 670 opt: 2975 Z-score: 3436.6 bits: 647.5 E(32554): 4.3e-185
Smith-Waterman score: 2977; 46.7% identity (72.7% similar) in 1019 aa overlap (50-1057:10-1012)
20 30 40 50 60 70
pF1KB4 GSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVSG
.:: :::::::::: ::.:.: . :::::
CCDS28 MDALDASKLLDEELYSRQLYVLGSPAMQRIQGARVLVSG
10 20 30
80 90 100 110 120 130
pF1KB4 LRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPRLAELN
:.:::.:.:::..: :: ..:::: . :.::..:: : :.:. ..:::.:: ::.::
CCDS28 LQGLGAEVAKNLVLMGVGSLTLHDPHPTCWSDLAAQFLLSEQDLERSRAEASQELLAQLN
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB4 SYVPVTAYTGPLVEDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADTRGLFGQLF
: :...:: ..::.: ::::::: . ::.::.:: .::..:. ...:::::: ::::
CCDS28 RAVQVVVHTGDITEDLLLDFQVVVLTAAKLEEQLKVGTLCHKHGVCFLAADTRGLVGQLF
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB4 CDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEAR-HGFESGDFVSFSEVQGMVE
:::::.. . : . .::.: .. ... .::..: : : :..::.:.:: ..::::
CCDS28 CDFGEDFTVQDPTEAEPLTAAIQHISQGSPGILTLRKGANTHYFRDGDLVTFSGIEGMVE
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB4 LNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLAEPDFVVT
:: .: :.: .. : ::..:: :.::: ...:: :: . ::: ..: .: :.
CCDS28 LNDCDPRSIHVREDGSLEIGDTTTFSRYLRGGAITEVKRPKTVRHKSLDTALLQPHVVAQ
220 230 240 250 260 270
320 330 340 350 360 370
pF1KB4 DFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNA--RALPAVQQN
. . . :: .: :::.: :::::.: . :: .:.::. .. :. ..
CCDS28 SSQEVHHAHCLHQAFCALHKFQHLHGRPPQPWDPVDAETVVGLARDLEPLKRTEEEPLEE
280 290 300 310 320 330
380 390 400 410 420 430
pF1KB4 NLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALECLPEDK
::: :.: .: .:: :.:. :..:..:::::.:: : ::::. ::::::::.:::::
CCDS28 PLDEALVRTVALSSAGVLSPMVAMLGAVAAQEVLKAISRKFMPLDQWLYFDALDCLPEDG
340 350 360 370 380 390
440 450 460 470 480 490
pF1KB4 EVL-TEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMIGLGCG
:.: . . : : .:::::.::::. .:::: .:.:.::::::::::::: ::..::: :
CCDS28 ELLPSPEDCALRGSRYDGQIAVFGAGFQEKLRRQHYLLVGAGAIGCELLKVFALVGLGAG
400 410 420 430 440 450
500 510 520 530 540 550
pF1KB4 EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQNRVGPD
..: . :.::: ::.:::.:::::: :: . :...::::.: .:: ..: . :
CCDS28 NSGGLTVVDMDHIERSNLSRQFLFRSQDVGRPKAEVAAAAARGLNPDLQVIPLTYPLDPT
460 470 480 490 500 510
560 570 580 590 600 610
pF1KB4 TERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQVVIPFLT
::.:: :.::. .:::: :::. .:: :. ::..: :::::.:: :: :.. : .: .:
CCDS28 TEHIYGDNFFSRVDGVAAALDSFQARRYVAARCTHYLKPLLEAGTSGTWGSATVFMPHVT
520 530 540 550 560 570
620 630 640 650 660
pF1KB4 ESY------SSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD
:.: ..:.: : :.::.. ::.. :::::::: ::: ::. ::..:..
CCDS28 EAYRAPASAAASEDAP---YPVCTVRYFPSTAEHTLQWARHEFEELFRLSAETINHH---
580 590 600 610 620 630
670 680 690 700 710 720
pF1KB4 PKFVERTLR-LAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQLLHN
. .. .: . : : .:. : : . :::.: :::.:: ::. . .:.:::..
CCDS28 -QQAHTSLADMDEPQTLTLLKPVLGVLRV-RPQNWQDCVAWALGHWKLCFHYGIKQLLRH
640 650 660 670 680 690
730 740 750 760 770 780
pF1KB4 FPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQDRAAVA
:::... .:.:::::::.::.:: ::.:. :: ::.:::::.:: .:: :::: .:.
CCDS28 FPPNKVLEDGTPFWSGPKQCPQPLEFDTNQDTHLLYVLAAANLYAQMHGLPGSQDWTALR
700 710 720 730 740 750
790 800 810 820 830 840
pF1KB4 TFLQSVQVPEFTPKSGVKIHVSDQELQSANASVDDSRLEELKATLPSPDKLPGFKMYPID
.:. .:. :.. . : .:. :: ::.: . .::. .: . : .: :.
CCDS28 ELLK--LLPQPDPQQMAPIFASNLELASASAEFGPEQQKELNKALEVWSVGPPLK--PLM
760 770 780 790 800
850 860 870 880 890 900
pF1KB4 FEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAAVVGLVCLE
::::::::::.::.:::..:: .:: :: ..: .:: :.:.::::::::::::.::. ::
CCDS28 FEKDDDSNFHVDFVVAAASLRCQNYGIPPVNRAQSKRIVGQIIPAIATTTAAVAGLLGLE
810 820 830 840 850 860
910 920 930 940 950 960
pF1KB4 LYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEVQGLQPNGE
:::::.: : .......:.:: .. :.: . ... .:: :::..: . ::
CCDS28 LYKVVSGPRPRSAFRHSYLHLAENYLIRYMPFAPAIQTFHHLKWTSWDRLKVPAGQP---
870 880 890 900 910 920
970 980 990 1000 1010 1020
pF1KB4 EMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPMTEIVSRVSKRKLG
: ::...: ... .: :.. .: .: ..::. : ..: .::.:.... . .
CCDS28 ERTLESLLAHLQEQHGLRVRILLHGSALLYAAGWSPEKQAQHLPLRVTELVQQLTGQAPA
930 940 950 960 970 980
1030 1040 1050
pF1KB4 RHVRALVLELCCNDESGEDVEVPYVRYTIR
:.::::: :. .. ::. : ..: .
CCDS28 PGQRVLVLELSCEGDD-EDTAFPPLHYEL
990 1000 1010
>>CCDS3516.1 UBA6 gene_id:55236|Hs108|chr4 (1052 aa)
initn: 2189 init1: 950 opt: 2606 Z-score: 3009.1 bits: 568.4 E(32554): 2.8e-161
Smith-Waterman score: 2606; 42.7% identity (71.1% similar) in 1030 aa overlap (49-1055:38-1045)
20 30 40 50 60 70
pF1KB4 PGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSSVLVS
.::..::::: :::: ::... : :..:
CCDS35 AAHQGEEASCSSWGTGSTNKNLPIMSTASVEIDDALYSRQRYVLGDTAMQKMAKSHVFLS
10 20 30 40 50 60
80 90 100 110 120 130
pF1KB4 GLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDI--GKNRAEVSQPRLA
:. :::.:::::..:.:.::::.:: : ::...:.: :.:. .::::. ..:
CCDS35 GMGGLGLEIAKNLVLAGIKAVTIHDTEKCQAWDLGTNFFLSEDDVVNKRNRAEAVLKHIA
70 80 90 100 110 120
140 150 160 170 180 190
pF1KB4 ELNSYVPVTAYTGPLVE----DFLSGFQVVVLTNTPLEDQLRVGEFCHNR--GIKLVVAD
::: :: ::. . :. : .::. .: ::::. : : ....::... ::.. ::
CCDS35 ELNPYVHVTSSSVPFNETTDLSFLDKYQCVVLTEMKLPLQKKINDFCRSQCPPIKFISAD
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB4 TRGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSF
..:....::::::.:. . :..::.: ..: .:. :::.::::.. : .:.:.:..:
CCDS35 VHGIWSRLFCDFGDEFEVLDTTGEEPKEIFISNITQANPGIVTCLENHPHKLETGQFLTF
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB4 SEVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASL
:..::. :::. ..: :..:..::: ::... :..:::. :::.:: . :.:: .:
CCDS35 REINGMTGLNGSI-QQITVISPFSFSIGDTTELEPYLHGGIAVQVKTPKTVFFESLERQL
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB4 AEPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARAL
.: ...::.. : ..: .. :: :: ...: : ..:. ::. :: ... ..:
CCDS35 KHPKCLIVDFSNPEAPLEIHTAMLALDQFQEKYSRKPNVGCQQDSEELLKLATSIS-ETL
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB4 PAVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDALE
.. ... :... :...: : :.:. : .::.:.:::.:: .::: :. ::::..: .
CCDS35 E--EKPDVNADIVHWLSWTAQGFLSPLAAAVGGVASQEVLKAVTGKFSPLCQWLYLEAAD
370 380 390 400 410 420
440 450 460 470 480
pF1KB4 CLPEDKEVLTEDKC---LQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNF
. : : . .: : : .:::. : .:. : .:: . . :::: ::::::.::::
CCDS35 IV----ESLGKPECEEFLPRGDRYDALRACIGDTLCQKLQNLNIFLVGCGAIGCEMLKNF
430 440 450 460 470
490 500 510 520 530 540
pF1KB4 AMIGLGCG-EGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVT
:..:.: . : : : ::: : :::::::::::::: . : :: ::: :. ..: .:..
CCDS35 ALLGVGTSKEKGMITVTDPDLIEKSNLNRQFLFRPHHIQKPKSYTAADATLKINSQIKID
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB4 SHQNRVGPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGN
.: :.: : :: ::.:.:. . : . .:::::.:: :.: ::. .:::.:::.::::.
CCDS35 AHLNKVCPTTETIYNDEFYTKQDVIITALDNVEARRYVDSRCLANLRPLLDSGTMGTKGH
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB4 VQVVIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQY
..:..: :::::.: .::::. ::.::::.:: :::::.:::::.::. :.. :..
CCDS35 TEVIVPHLTESYNSHRDPPEEEIPFCTLKSFPAAIEHTIQWARDKFESSFSHKPSLFNKF
600 610 620 630 640 650
670 680 690 700 710 720
pF1KB4 LTDPKFVERTL-RLAGTQPLEVLEAVQRSLVLQRPQTWADCVTWACHHWHTQYSNNIRQL
. .:..: .. . . :: : . :. .::..:..:: : ... .... ::
CCDS35 WQTYSSAEEVLQKIQSGHSLEGCFQVIK-LLSRRPRNWSQCVELARLKFEKYFNHKALQL
660 670 680 690 700 710
730 740 750 760 770 780
pF1KB4 LHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLT-GSQDR
:: :: : ..:. ::..::: : :. ::.:.::::.... ::.:.: .: . . .:
CCDS35 LHCFPLDIRLKDGSLFWQSPKRPPSPIKFDLNEPLHLSFLQNAAKLYATVYCIPFAEEDL
720 730 740 750 760 770
790 800 810 820 830
pF1KB4 AAVATF--LQSVQVPEFTPKSGVKIHVSDQELQSAN---ASVDDSR---LEELKATLPSP
.: : . :. :.. :: :.. :. .:. .. . : .: : .. :: : .
CCDS35 SADALLNILSEVKIQEFKPSN--KVVQTDETARKPDHVPISSEDERNAIFQLEKAILSNE
780 790 800 810 820 830
840 850 860 870 880 890
pF1KB4 DKLPGFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIAT
..: ..:::::: : :.:::.:::::::. :.: ::: :.: :::::::::::
CCDS35 ATKSDLQMAVLSFEKDDDHNGHIDFITAASNLRAKMYSIEPADRFKTKRIAGKIIPAIAT
840 850 860 870 880 890
900 910 920 930 940 950
pF1KB4 TTAAVVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQ-EWTLW
:::.: ::: ::. ::. :. ...::: :::::.:. :.: . . . : .:.:
CCDS35 TTATVSGLVALEMIKVTGGY-PFEAYKNCFLNLAIPIVVFTETTEVRKTKIRNGISFTIW
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KB4 DRFEVQGLQPNGEEMTLKQFLDYFKTEHKLEITMLSQGVSMLYSFFMPAAKLKERLDQPM
::. :.: :..:: .:.. : .. .: ::. :::.::: ::. .:: :
CCDS35 DRWTVHG----KEDFTLLDFINAVKEKYGIEPTMVVQGVKMLYVPVMPGH--AKRLKLTM
960 970 980 990 1000
1020 1030 1040 1050
pF1KB4 TEIVSRVSKRKLGRHVRALVLELCCNDESGEDVEVPYVRYTIR
..:. ....: .: :.. . . .. ::. : :::
CCDS35 HKLVKPTTEKK---YVD-LTVSFAPDIDGDEDLPGPPVRYYFSHDTD
1010 1020 1030 1040 1050
>>CCDS12439.1 UBA2 gene_id:10054|Hs108|chr19 (640 aa)
initn: 484 init1: 235 opt: 445 Z-score: 510.5 bits: 105.4 E(32554): 4.1e-22
Smith-Waterman score: 585; 31.6% identity (58.8% similar) in 478 aa overlap (461-928:10-419)
440 450 460 470 480 490
pF1KB4 CLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLKNFAMI
.: : .. . ..::::.::::::::...
CCDS12 MALSRGLPRELAEAVAGGRVLVVGAGGIGCELLKNLVLT
10 20 30
500 510 520 530 540 550
pF1KB4 GLGCGEGGEIIVTDMDTIEKSNLNRQFLFRPWDVTKLKSDTAAAAVRQMNPHIRVTSHQN
:.. .: . :.:::. :::::::::. : . :...: .: :. :. ......
CCDS12 GFS-----HIDLIDLDTIDVSNLNRQFLFQKKHVGRSKAQVAKESVLQFYPKANIVAYHD
40 50 60 70 80 90
560 570 580 590 600
pF1KB4 RV-GPDTERIYDDDFFQNLDGVANALDNVDARMYMDRRCVYYRKPLLESGTLGTKGNVQV
. .:: :. .::... : ::::: :: ...: :. ::.:::: : :.: .
CCDS12 SIMNPD----YNVEFFRQFILVMNALDNRAARNHVNRMCLAADVPLIESGTAGYLGQVTT
100 110 120 130 140 150
610 620 630 640 650 660
pF1KB4 VIPFLTESYSSSQDPPEKSIPICTLKNFPNAIEHTLQWARDEFEGLFKQPAENVNQYLTD
. .:: : : ....: ::..: :. : . ::. :. :: . :...: ..
CCDS12 IKKGVTECYECHPKPTQRTFPGCTIRNTPSEPIHCIVWAKYLFNQLFGE--EDADQEVS-
160 170 180 190 200
670 680 690 700 710 720
pF1KB4 PKFVERTLRLAGTQPLEVLEAVQRSLV----LQRPQT--WADCVTWACHHWHTQ-YSNNI
: .:. :. .: :. :: :. ..: .: :: . . . :. ....:
CCDS12 P---DRADPEAAWEPTEA-EARARASNEDGDIKRISTKEWAKSTGYDPVKLFTKLFKDDI
210 220 230 240 250 260
730 740 750 760 770 780
pF1KB4 RQLLHNFPPDQLTSSGAPFWSGPKRCPHPLTFDVNNPLHLDYVMAAANLFAQTYGLTGSQ
: :: :.: : :: : :. ::.. . ::
CCDS12 RYLLTM---DKL-------WR--KRKP---------PVPLDWAEVQ------------SQ
270 280 290
790 800 810 820 830 840
pF1KB4 DRAAVATFLQSVQVPEFTPKSGVKIHVSDQELQSAN--ASVDDSRLEELKATLPSPDKLP
. . :. :. :. :.: ::.. ... : . .. .: :.. : .:
CCDS12 GEETNASDQQN------EPQLGLK----DQQVLDVKSYARLFSKSIETLRVHLA--EKGD
300 310 320 330
850 860 870 880 890 900
pF1KB4 GFKMYPIDFEKDDDSNFHMDFIVAASNLRAENYDIPSADRHKSKLIAGKIIPAIATTTAA
: .. ..::: : :::...:.::: . ... .: : .::.::::::::.:.
CCDS12 GAELI---WDKDDPSA--MDFVTSAANLRMHIFSMNMKSRFDIKSMAGNIIPAIATTNAV
340 350 360 370 380 390
910 920 930 940 950 960
pF1KB4 VVGLVCLELYKVVQGHRQLDSYKNGFLNLALPFFGFSEPLAAPRHQYYNQEWTLWDRFEV
..::. :: :...: ..:. .. :::
CCDS12 IAGLIVLEGLKILSG--KIDQCRTIFLNKQPNPRKKLLVPCALDPPNPNCYVCASKPEVT
400 410 420 430 440 450
>>CCDS54284.1 SAE1 gene_id:10055|Hs108|chr19 (266 aa)
initn: 394 init1: 263 opt: 363 Z-score: 421.6 bits: 87.7 E(32554): 3.7e-17
Smith-Waterman score: 363; 36.7% identity (67.6% similar) in 188 aa overlap (45-229:9-192)
20 30 40 50 60 70
pF1KB4 PDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSS
:. .. . . :.::. . : ::.:::..:
CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASR
10 20 30
80 90 100 110 120 130
pF1KB4 VLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPR
::. ::.:::.:::::.::.:::..:. :. . : ..:: .: ..:.::::.: :
CCDS54 VLLVGLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLER
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB4 LAELNSYVPVTAYTGPLV---EDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADT
.:: .: : . : . :.:.. :..: :: . ..: ..::. .::. ..:.
CCDS54 AQNLNPMVDVKVDTEDIEKKPESFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDV
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB4 RGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSFS
: : : ..::. .. :. : ::. ..:.:
CCDS54 FGYHGYTFANLGEHEFVE----EKTKVAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFC
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB4 EVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLA
CCDS54 PVKEALEVDWSSEKAKAALKRTTSDYFLLQGTASPRWPQCVRWLEGFWHRKL
220 230 240 250 260
>>CCDS54285.1 SAE1 gene_id:10055|Hs108|chr19 (299 aa)
initn: 358 init1: 263 opt: 363 Z-score: 420.8 bits: 87.7 E(32554): 4.1e-17
Smith-Waterman score: 363; 36.7% identity (67.6% similar) in 188 aa overlap (45-229:9-192)
20 30 40 50 60 70
pF1KB4 PDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSS
:. .. . . :.::. . : ::.:::..:
CCDS54 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASR
10 20 30
80 90 100 110 120 130
pF1KB4 VLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPR
::. ::.:::.:::::.::.:::..:. :. . : ..:: .: ..:.::::.: :
CCDS54 VLLVGLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLER
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB4 LAELNSYVPVTAYTGPLV---EDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADT
.:: .: : . : . :.:.. :..: :: . ..: ..::. .::. ..:.
CCDS54 AQNLNPMVDVKVDTEDIEKKPESFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDV
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB4 RGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSFS
: : : ..::. .. :. : ::. ..:.:
CCDS54 FGYHGYTFANLGEHEFVE----EKTKVAKVSQGVEDGPDTKRAKLDSSETTMVKKKVVFC
160 170 180 190 200 210
260 270 280 290 300 310
pF1KB4 EVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLA
CCDS54 PVKEALEVDWSSEKAKAALKRTTSDYFLLQGPVSAGPSSQQLLLLRWHEGEWDCGVPWPQ
220 230 240 250 260 270
>>CCDS12696.1 SAE1 gene_id:10055|Hs108|chr19 (346 aa)
initn: 445 init1: 263 opt: 363 Z-score: 419.8 bits: 87.7 E(32554): 4.6e-17
Smith-Waterman score: 413; 28.7% identity (56.7% similar) in 397 aa overlap (45-432:9-343)
20 30 40 50 60 70
pF1KB4 PDPKPGSNCSPAQSVLSEVPSVPTNGMAKNGSEADIDEGLYSRQLYVLGHEAMKRLQTSS
:. .. . . :.::. . : ::.:::..:
CCDS12 MVEKEEAGGGISEEEAAQYDRQIRLWGLEAQKRLRASR
10 20 30
80 90 100 110 120 130
pF1KB4 VLVSGLRGLGVEIAKNIILGGVKAVTLHDQGTAQWADLSSQFYLREEDIGKNRAEVSQPR
::. ::.:::.:::::.::.:::..:. :. . : ..:: .: ..:.::::.: :
CCDS12 VLLVGLKGLGAEIAKNLILAGVKGLTMLDHEQVTPEDPGAQFLIRTGSVGRNRAEASLER
40 50 60 70 80 90
140 150 160 170 180 190
pF1KB4 LAELNSYVPVTAYTGPLV---EDFLSGFQVVVLTNTPLEDQLRVGEFCHNRGIKLVVADT
.:: .: : . : . :.:.. :..: :: . ..: ..::. .::. ..:.
CCDS12 AQNLNPMVDVKVDTEDIEKKPESFFTQFDAVCLTCCSRDVIVKVDQICHKNSIKFFTGDV
100 110 120 130 140 150
200 210 220 230 240 250
pF1KB4 RGLFGQLFCDFGEEMILTDSNGEQPLSAMVSMVTKDNPGVVTCLDEARHGFESGDFVSFS
: : : ..::. .. :. : ::. ..:.: : : ..:.. .
CCDS12 FGYHGYTFANLGEHEFVE----EKTKVAKVSQGVEDGP------DTKRAKLDSSETT---
160 170 180 190 200
260 270 280 290 300 310
pF1KB4 EVQGMVELNGNQPMEIKVLGPYTFSICDTSNFSDYIRGGIVSQVKVPKKISFKSLVASLA
::. ::. .: :: .....: :.
CCDS12 ----MVKK--------KVV------FCP---------------VKEALEVDWSSEKAK--
210 220 230
320 330 340 350 360 370
pF1KB4 EPDFVVTDFAKFSRPAQLHIGFQALHQFCAQHGRPPRPRNEEDAAELVALAQAVNARALP
: ..: .. .. .:.: .: ...:: : . :. .::. . .:
CCDS12 ---------AALKRTTSDYFLLQVLLKFRTDKGRDPSSDTYEEDSELLLQIRNDVLDSL-
240 250 260 270 280
380 390 400 410 420
pF1KB4 AVQQNNLDEDLIRKLAYVAAGDLAPINAFIGGLAAQEVMKACSGKFMPIMQWLYFDAL--
... . : ::..: ...::. : .::. :::..:: : . : ....::..
CCDS12 GISPDLLPEDFVR----YCFSEMAPVCAVVGGILAQEIVKALSQRDPPHNNFFFFDGMKG
290 300 310 320 330
430 440 450 460 470 480
pF1KB4 ----ECLPEDKEVLTEDKCLQRQNRYDGQVAVFGSDLQEKLGKQKYFLVGAGAIGCELLK
:::
CCDS12 NGIVECLGPK
340
1058 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:32:27 2016 done: Thu Nov 3 14:32:28 2016
Total Scan time: 4.640 Total Display time: 0.190
Function used was FASTA [36.3.4 Apr, 2011]