FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3683, 1174 aa
1>>>pF1KB3683 1174 - 1174 aa - 1174 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8091+/-0.00117; mu= 19.3292+/- 0.070
mean_var=66.1258+/-13.693, 0's: 0 Z-trim(101.4): 25 B-trim: 348 in 2/47
Lambda= 0.157721
statistics sampled from 6487 (6497) to 6487 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.545), E-opt: 0.2 (0.2), width: 16
Scan time: 3.970
The best scores are: opt bits E(32554)
CCDS3511.1 POLR2B gene_id:5431|Hs108|chr4 (1174) 7858 1797.8 0
CCDS77915.1 POLR2B gene_id:5431|Hs108|chr4 (1167) 7808 1786.5 0
CCDS77916.1 POLR2B gene_id:5431|Hs108|chr4 (1099) 7299 1670.6 0
CCDS53824.1 POLR3B gene_id:55703|Hs108|chr12 (1075) 1625 379.6 2.3e-104
CCDS9105.1 POLR3B gene_id:55703|Hs108|chr12 (1133) 1625 379.6 2.4e-104
CCDS62990.1 POLR1B gene_id:84172|Hs108|chr2 ( 924) 416 104.4 1.3e-21
CCDS62989.1 POLR1B gene_id:84172|Hs108|chr2 ( 952) 416 104.4 1.3e-21
CCDS46395.1 POLR1B gene_id:84172|Hs108|chr2 (1079) 416 104.5 1.5e-21
CCDS2097.1 POLR1B gene_id:84172|Hs108|chr2 (1135) 416 104.5 1.5e-21
CCDS62988.1 POLR1B gene_id:84172|Hs108|chr2 (1173) 416 104.5 1.6e-21
>>CCDS3511.1 POLR2B gene_id:5431|Hs108|chr4 (1174 aa)
initn: 7858 init1: 7858 opt: 7858 Z-score: 9651.6 bits: 1797.8 E(32554): 0
Smith-Waterman score: 7858; 100.0% identity (100.0% similar) in 1174 aa overlap (1-1174:1-1174)
10 20 30 40 50 60
pF1KB3 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB3 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB3 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB3 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB3 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB3 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB3 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB3 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB3 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB3 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB3 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB3 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB3 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC
1090 1100 1110 1120 1130 1140
1150 1160 1170
pF1KB3 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
::::::::::::::::::::::::::::::::::
CCDS35 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
1150 1160 1170
>>CCDS77915.1 POLR2B gene_id:5431|Hs108|chr4 (1167 aa)
initn: 7808 init1: 7808 opt: 7808 Z-score: 9590.2 bits: 1786.5 E(32554): 0
Smith-Waterman score: 7808; 100.0% identity (100.0% similar) in 1167 aa overlap (8-1174:1-1167)
10 20 30 40 50 60
pF1KB3 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 MQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE
10 20 30 40 50
70 80 90 100 110 120
pF1KB3 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB3 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB3 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRPTSTIWVSML
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB3 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMMEM
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB3 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHVGVSDFCETK
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB3 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 KAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKEVRIYAQ
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB3 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 KFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLNRLTFASTLS
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB3 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAYISVGSQPSP
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB3 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLRRQMDIIVSE
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB3 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASG
600 610 620 630 640 650
670 680 690 700 710 720
pF1KB3 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSP
660 670 680 690 700 710
730 740 750 760 770 780
pF1KB3 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 RNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIV
720 730 740 750 760 770
790 800 810 820 830 840
pF1KB3 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEKPTRETCQGM
780 790 800 810 820 830
850 860 870 880 890 900
pF1KB3 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 RHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRDCSTFLRTSE
840 850 860 870 880 890
910 920 930 940 950 960
pF1KB3 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEG
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KB3 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKISNLLSDYGY
960 970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KB3 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSR
1020 1030 1040 1050 1060 1070
1090 1100 1110 1120 1130 1140
pF1KB3 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTRTHTYECRGC
1080 1090 1100 1110 1120 1130
1150 1160 1170
pF1KB3 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
::::::::::::::::::::::::::::::::::
CCDS77 RNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
1140 1150 1160
>>CCDS77916.1 POLR2B gene_id:5431|Hs108|chr4 (1099 aa)
initn: 7299 init1: 7299 opt: 7299 Z-score: 8964.7 bits: 1670.6 E(32554): 0
Smith-Waterman score: 7299; 100.0% identity (100.0% similar) in 1093 aa overlap (82-1174:7-1099)
60 70 80 90 100 110
pF1KB3 QMSVQRIVEDAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPN
::::::::::::::::::::::::::::::
CCDS77 MLDCNQPRYLLKFEQIYLSKPTHWERDGAPSPMMPN
10 20 30
120 130 140 150 160 170
pF1KB3 EARLRNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 EARLRNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDL
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB3 CELNECPLDPGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 CELNECPLDPGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCLENSSRP
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB3 TSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYD
160 170 180 190 200 210
300 310 320 330 340 350
pF1KB3 FEDPEMMEMVKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 FEDPEMMEMVKPSLDEAFVIQEQNVALNFIGSRGAKPGVTKEKRIKYAKEVLQKEMLPHV
220 230 240 250 260 270
360 370 380 390 400 410
pF1KB3 GVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNL
280 290 300 310 320 330
420 430 440 450 460 470
pF1KB3 LKEVRIYAQKFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LKEVRIYAQKFIDRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLN
340 350 360 370 380 390
480 490 500 510 520 530
pF1KB3 RLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 RLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAY
400 410 420 430 440 450
540 550 560 570 580 590
pF1KB3 ISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVGIHKDPEQLMNTLRKLR
460 470 480 490 500 510
600 610 620 630 640 650
pF1KB3 RQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 RQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYNNY
520 530 540 550 560 570
660 670 680 690 700 710
pF1KB3 SWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCASII
580 590 600 610 620 630
720 730 740 750 760 770
pF1KB3 PFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRFRE
640 650 660 670 680 690
780 790 800 810 820 830
pF1KB3 LPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYKEQESKKGFDQEEVFEK
700 710 720 730 740 750
840 850 860 870 880 890
pF1KB3 PTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPENEDELESTNRRYTKRD
760 770 780 790 800 810
900 910 920 930 940 950
pF1KB3 CSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 CSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQ
820 830 840 850 860 870
960 970 980 990 1000 1010
pF1KB3 EDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 EDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATPFNDAVNVQKI
880 890 900 910 920 930
1020 1030 1040 1050 1060 1070
pF1KB3 SNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILN
940 950 960 970 980 990
1080 1090 1100 1110 1120 1130
pF1KB3 RQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 RQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIMAIANTR
1000 1010 1020 1030 1040 1050
1140 1150 1160 1170
pF1KB3 THTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
:::::::::::::::::::::::::::::::::::::::::::
CCDS77 THTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
1060 1070 1080 1090
>>CCDS53824.1 POLR3B gene_id:55703|Hs108|chr12 (1075 aa)
initn: 2121 init1: 802 opt: 1625 Z-score: 1987.3 bits: 379.6 E(32554): 2.3e-104
Smith-Waterman score: 2618; 39.4% identity (69.2% similar) in 1109 aa overlap (82-1171:13-1068)
60 70 80 90 100 110
pF1KB3 QMSVQRIVEDAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPN
: . ::. .::.. : : .. :. :.
CCDS53 MKANEKVTSDADPMWYLKYLNIYVGLPDVEESFNVTRPVSPH
10 20 30 40
120 130 140 150 160 170
pF1KB3 EARLRNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDL
: :::..:::::. ::: : .: ... .. ::..::::::. :.:.: : ..
CCDS53 ECRLRDMTYSAPITVDIEYT---RGSQRII--RNALPIGRMPIMLRSSNCVLTGKTPAEF
50 60 70 80 90
180 190 200 210 220 230
pF1KB3 CELNECPLDPGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCL-ENSSR
.:::::::::::::..: :::.. ::... : . : : : : : . : :..::
CCDS53 AKLNECPLDPGGYFIVKGVEKVILIQEQLSKNRIIVEA--DRKGAVGASVTSSTHEKKSR
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB3 PTSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIY
..: .. : :. .....::.:.:.:.: ::..:.. :
CCDS53 ------TNMAVKQG----------RFYLRHNTLSEDIPIVIIFKAMGVESDQEIVQMIG-
160 170 180 190
300 310 320 330 340
pF1KB3 DFEDPEMMEMVKPSLDEAFVIQ--EQNVALNFIGSRGAKP----GVTKEKRIKYAKEVLQ
. ..: :::.: : : ::..::.. . : :. .:. :.:.:
CCDS53 --TEEHVMAAFGPSLEECQKAQIFTQMQALKYIGNKVRRQRMWGGGPKKTKIEEARELLA
200 210 220 230 240 250
350 360 370 380 390 400
pF1KB3 KEMLPHVGVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLF
. .: :: :..: : . . ::.:..:: : ..::::.::::::.::: ::..::
CCDS53 STILTHVPVKEFNFRAKCIYTAVMVRRVILAQ-GDNKVDDRDYYGNKRLELAGQLLSLLF
260 270 280 290 300 310
410 420 430 440 450 460
pF1KB3 RGMFKNLLKEVRIYAQKFI--DRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQA
. .::.. .:.. :.. : .:. .:.. .. :..:. ...::::. :. ..
CCDS53 EDLFKKFNSEMKKIADQVIPKQRAAQFDVVKHMRQDQITNGMVNAISTGNWS-LKRFKMD
320 330 340 350 360 370
470 480 490 500 510 520
pF1KB3 RAGVSQVLNRLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGL
: ::.:::.::.. :.:. . :..: . . :.. ::.:. . :::.::..::::.: ::
CCDS53 RQGVTQVLSRLSYISALGMMTRISSQFEKTRKVSGPRSLQPSQWGMLCPSDTPEGEACGL
380 390 400 410 420 430
530 540 550 560 570 580
pF1KB3 VKNLALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIA--DATKIFVNGCWVGIHKDP
:::::::..:.. . .::... . ..:... . .. .. .:.:: .:. .:
CCDS53 VKNLALMTHITTDMEDGPIVKLASNLGVEDVNLLCGEELSYPNVFLVFLNGNILGVIRDH
440 450 460 470 480 490
590 600 610 620 630 640
pF1KB3 EQLMNTLRKLRRQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHI
..:.::.: .:: : ::. .. .: . : .:.::.::: .::.::: . ..:.
CCDS53 KKLVNTFRLMRRA-GYINEFVSISTNLTDRCVYISSDGGRLCRPYIIVKKQKPAVTNKHM
500 510 520 530 540 550
650 660 670 680 690 700
pF1KB3 DQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHP
..: . : :. .:.. ..:::.:. ::. .:. ... :: ::.:
CCDS53 EELAQG-YRNF--EDFLHESLVEYLDVNEENDCNIALYEHTINKDT-------THLEIEP
560 570 580 590 600
710 720 730 740 750 760
pF1KB3 SMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVT
.:::::..::.: :::::::::: ::::::::. : . :.::: ..: :::::.:
CCDS53 FTLLGVCAGLIPYPHHNQSPRNTYQCAMGKQAMGTIGYNQRNRIDTLMYLLAYPQKPMVK
610 620 630 640 650 660
770 780 790 800 810
pF1KB3 TRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYK---EQ
:...: ..:..:::: :. ::. ::.::. ::....:....:::: : . :.. : ..
CCDS53 TKTIELIEFEKLPAGQNATVAVMSYSGYDIEDALVLNKASLDRGFGRCLVYKNAKCTLKR
670 680 690 700 710 720
820 830 840 850 860 870
pF1KB3 ESKKGFDQE--EVFEKPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPE
... ::. ... ::. :: : :: ::. .:: .: . .:...:. .:
CCDS53 YTNQTFDKVMGPMLDAATRKPIW--RHEI---LDADGICSPGEKVENKQVLVNKS--MPT
730 740 750 760 770
880 890 900 910 920 930
pF1KB3 -NEDELESTN--RRYTKRDCSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIG
.. ::..: .. .: . . . ...::.. : : . :. .:..: :.::
CCDS53 VTQIPLEGSNVPQQPQYKDVPITYKGATDSYIEKVMISSNAEDAFLIKMLLRQTRRPEIG
780 790 800 810 820 830
940 950 960 970 980 990
pF1KB3 DKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSAN
:::.:::::::.::. :::::: :: ::::.:::..:::::.:.::: : ::...
CCDS53 DKFSSRHGQKGVCGLIVPQEDMPFCDSGICPDIIMNPHGFPSRMTVGKLIELLAGKAGVL
840 850 860 870 880 890
1000 1010 1020 1030 1040 1050
pF1KB3 KGEIGDATPFNDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLK
:.. .: :. . .:. . . : .::. :.. . .:.::. . . :..::.:::.::
CCDS53 DGRFHYGTAFGGS-KVKDVCEDLVRHGYNYLGKDYVTSGITGEPLEAYIYFGPVYYQKLK
900 910 920 930 940 950
1060 1070 1080 1090 1100 1110
pF1KB3 HMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASD
::: ::.:.::::: .:.::: ::::::::::.::::::: :..::...: :::. .::
CCDS53 HMVLDKMHARARGPRAVLTRQPTEGRSRDGGLRLGEMERDCLIGYGASMLLLERLMISSD
960 970 980 990 1000 1010
1120 1130 1140 1150 1160 1170
pF1KB3 PYQVHVCNLCGIMAIANTRTHTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMM
..: ::. ::... .. :. :... ..: .:.:::::::::::.::.: ::.
CCDS53 AFEVDVCGQCGLLG------YSGWCHYCKSSCHVSSLRIPYACKLLFQELQSMNIIPRLK
1020 1030 1040 1050 1060
pF1KB3 SV
CCDS53 LSKYNE
1070
>>CCDS9105.1 POLR3B gene_id:55703|Hs108|chr12 (1133 aa)
initn: 2189 init1: 802 opt: 1625 Z-score: 1986.9 bits: 379.6 E(32554): 2.4e-104
Smith-Waterman score: 2692; 38.6% identity (68.6% similar) in 1167 aa overlap (24-1171:24-1126)
10 20 30 40 50 60
pF1KB3 MYDADEDMQYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVE
: : .. ... ::::.:..:::. ::.. ...:..
CCDS91 MDVLAEEFGNLTPEQLAAPIPTVEEKWRLLPAFLKVKGLVKQHIDSFNYFINVEIKKIMK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 DAPPIDLQAEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERDGAPSPMMPNEARLRNLTY
. .:. : . ::. .::.. : : .. :. :.: :::..::
CCDS91 ANEKVTSDAD-----------PMWYLKYLNIYVGLPDVEESFNVTRPVSPHECRLRDMTY
70 80 90 100
130 140 150 160 170 180
pF1KB3 SAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLD
:::. ::: : .: ... .. ::..::::::. :.:.: : .. .:::::::
CCDS91 SAPITVDIEYT---RGSQRII--RNALPIGRMPIMLRSSNCVLTGKTPAEFAKLNECPLD
110 120 130 140 150 160
190 200 210 220 230
pF1KB3 PGGYFIINGSEKVLIAQEKMATNTVYVFAKKDSKYAYTGECRSCL-ENSSRPTSTIWVSM
::::::..: :::.. ::... : . : : : : : . : :..:: ..:
CCDS91 PGGYFIVKGVEKVILIQEQLSKNRIIVEA--DRKGAVGASVTSSTHEKKSR------TNM
170 180 190 200 210
240 250 260 270 280 290
pF1KB3 LARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPEMME
.. : :. .....::.:.:.:.: ::..:.. : . ..:
CCDS91 AVKQG----------RFYLRHNTLSEDIPIVIIFKAMGVESDQEIVQMIG---TEEHVMA
220 230 240 250 260
300 310 320 330 340 350
pF1KB3 MVKPSLDEAFVIQ--EQNVALNFIGSRGAKP----GVTKEKRIKYAKEVLQKEMLPHVGV
:::.: : : ::..::.. . : :. .:. :.:.: . .: :: :
CCDS91 AFGPSLEECQKAQIFTQMQALKYIGNKVRRQRMWGGGPKKTKIEEARELLASTILTHVPV
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB3 SDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLK
..: : . . ::.:..:: : ..::::.::::::.::: ::..::. .::.. .
CCDS91 KEFNFRAKCIYTAVMVRRVILAQ-GDNKVDDRDYYGNKRLELAGQLLSLLFEDLFKKFNS
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB3 EVRIYAQKFI--DRGKDFNLELAIKTRIISDGLKYSLATGNWGDQKKAHQARAGVSQVLN
:.. :.. : .:. .:.. .. :..:. ...::::. :. .. : ::.:::.
CCDS91 EMKKIADQVIPKQRAAQFDVVKHMRQDQITNGMVNAISTGNWS-LKRFKMDRQGVTQVLS
390 400 410 420 430 440
480 490 500 510 520 530
pF1KB3 RLTFASTLSHLRRLNSPIGRDGKLAKPRQLHNTLWGMVCPAETPEGHAVGLVKNLALMAY
::.. :.:. . :..: . . :.. ::.:. . :::.::..::::.: :::::::::..
CCDS91 RLSYISALGMMTRISSQFEKTRKVSGPRSLQPSQWGMLCPSDTPEGEACGLVKNLALMTH
450 460 470 480 490 500
540 550 560 570 580
pF1KB3 ISVGSQPSPILEFLEEWSMENLEEISPAAIA--DATKIFVNGCWVGIHKDPEQLMNTLRK
:.. . .::... . ..:... . .. .. .:.:: .:. .: ..:.::.:
CCDS91 ITTDMEDGPIVKLASNLGVEDVNLLCGEELSYPNVFLVFLNGNILGVIRDHKKLVNTFRL
510 520 530 540 550 560
590 600 610 620 630 640
pF1KB3 LRRQMDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKLLLKKRHIDQLKEREYN
.:: : ::. .. .: . : .:.::.::: .::.::: . ..:...: . :
CCDS91 MRRA-GYINEFVSISTNLTDRCVYISSDGGRLCRPYIIVKKQKPAVTNKHMEELAQG-YR
570 580 590 600 610
650 660 670 680 690 700
pF1KB3 NYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTYTHCEIHPSMILGVCAS
:. .:.. ..:::.:. ::. .:. ... :: ::.: .:::::.
CCDS91 NF--EDFLHESLVEYLDVNEENDCNIALYEHTINKDT-------THLEIEPFTLLGVCAG
620 630 640 650 660 670
710 720 730 740 750 760
pF1KB3 IIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYYPQKPLVTTRSMEYLRF
.::.: :::::::::: ::::::::. : . :.::: ..: :::::.: :...: ..:
CCDS91 LIPYPHHNQSPRNTYQCAMGKQAMGTIGYNQRNRIDTLMYLLAYPQKPMVKTKTIELIEF
680 690 700 710 720 730
770 780 790 800 810 820
pF1KB3 RELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRSYK---EQESKKGFDQE
..:::: :. ::. ::.::. ::....:....:::: : . :.. : .. ... ::.
CCDS91 EKLPAGQNATVAVMSYSGYDIEDALVLNKASLDRGFGRCLVYKNAKCTLKRYTNQTFDKV
740 750 760 770 780 790
830 840 850 860 870 880
pF1KB3 --EVFEKPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKTVTLPE-NEDELEST
... ::. :: : :: ::. .:: .: . .:...:. .: .. ::..
CCDS91 MGPMLDAATRKPI--WRHEI---LDADGICSPGEKVENKQVLVNKS--MPTVTQIPLEGS
800 810 820 830 840
890 900 910 920 930 940
pF1KB3 N--RRYTKRDCSTFLRTSETGIVDQVMVTLNQEGYKFCKIRVRSVRIPQIGDKFASRHGQ
: .. .: . . . ...::.. : : . :. .:..: :.:::::.:::::
CCDS91 NVPQQPQYKDVPITYKGATDSYIEKVMISSNAEDAFLIKMLLRQTRRPEIGDKFSSRHGQ
850 860 870 880 890 900
950 960 970 980 990 1000
pF1KB3 KGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQGKVSANKGEIGDATP
::.::. :::::: :: ::::.:::..:::::.:.::: : ::... :.. .:
CCDS91 KGVCGLIVPQEDMPFCDSGICPDIIMNPHGFPSRMTVGKLIELLAGKAGVLDGRFHYGTA
910 920 930 940 950 960
1010 1020 1030 1040 1050 1060
pF1KB3 FNDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFIGPTYYQRLKHMVDDKIHS
:. . .:. . . : .::. :.. . .:.::. . . :..::.:::.::::: ::.:.
CCDS91 FGGS-KVKDVCEDLVRHGYNYLGKDYVTSGITGEPLEAYIYFGPVYYQKLKHMVLDKMHA
970 980 990 1000 1010 1020
1070 1080 1090 1100 1110 1120
pF1KB3 RARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFLRERLFEASDPYQVHVCNL
::::: .:.::: ::::::::::.::::::: :..::...: :::. .:: ..: ::.
CCDS91 RARGPRAVLTRQPTEGRSRDGGLRLGEMERDCLIGYGASMLLLERLMISSDAFEVDVCGQ
1030 1040 1050 1060 1070 1080
1130 1140 1150 1160 1170
pF1KB3 CGIMAIANTRTHTYECRGCRNKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
::... .. :. :... ..: .:.:::::::::::.::.: ::.
CCDS91 CGLLG------YSGWCHYCKSSCHVSSLRIPYACKLLFQELQSMNIIPRLKLSKYNE
1090 1100 1110 1120 1130
>>CCDS62990.1 POLR1B gene_id:84172|Hs108|chr2 (924 aa)
initn: 1126 init1: 368 opt: 416 Z-score: 501.6 bits: 104.4 E(32554): 1.3e-21
Smith-Waterman score: 1271; 30.7% identity (57.4% similar) in 952 aa overlap (267-1171:36-921)
240 250 260 270 280 290
pF1KB3 VSMLARGGQGAKKSAIGQRIVATLPYIKQEVPIIIVFRALGFVSDRDILEHIIYDFEDPE
.:. ....:: :: .:....: ::
CCDS62 EEHSAVNMNLHYLENGTVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQELIKGKEDDS
10 20 30 40 50 60
300 310 320 330 340 350
pF1KB3 MM-----EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEVLQKEMLPH
.. .:.. ..:. :.: .::..: .: .: . : : : ..
CCDS62 FLRNSVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEFLFNQC---
70 80 90 100 110 120
360 370 380 390 400 410
pF1KB3 VGVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKN
. . .:.: :.: :...:. : :. :. : :... : :. .... ...
CCDS62 ICIHLKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLMFLKEKLEG
130 140 150 160 170 180
420 430 440 450 460
pF1KB3 LLKEVRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQKKAHQAR-
: ..: .: .. . ... ::.. :. .: .:::: .. .
CCDS62 WLVSIKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSKTGLGLLQD
190 200 210 220 230
470 480 490 500 510 520
pF1KB3 AGVSQVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPAETPEGHAV
.:. : ..:.: :::.: .. : : .:. :.: ::..::..::.:.
CCDS62 SGLCVVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPVHTPDGEPC
240 250 260 270 280 290
530 540 550 560 570
pF1KB3 GLVKNL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVG-IHK
::...: :. .. . : .: . .. .. . .. ....: :: . :
CCDS62 GLMNHLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDGVMVGWVDK
300 310 320 330 340 350
580 590 600 610 620
pF1KB3 D-PEQLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVE
: . ..::. ::.. :.... .. .. . ..: :. ::.
CCDS62 DLAPGIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRLVRPV----
360 370 380 390 400 410
630 640 650 660 670 680
pF1KB3 KQKLLLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAY
:.: : :. : : :.:. . .:. :.. .
CCDS62 -QNLALGKE------------------------ELIGTMEQIFMNVAIFEDEV------F
420 430 440
690 700 710 720 730 740
pF1KB3 CSTYTHCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAH
.. :: :. : .:.: :..::: :::::::: :: ::::.:: . ... : :. .
CCDS62 AGVTTHQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDRSDNKLY
450 460 470 480 490 500
750 760 770 780 790 800
pF1KB3 VLYYPQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSV
: ::.::: ..: . . : : :.:::. :::::..::..:.:... .::: ..
CCDS62 RLQTPQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWERGFAHGS
510 520 530 540 550 560
810 820 830 840 850 860
pF1KB3 FYRS--YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVI
:.: .:. : :. :: :: . .::::::: :.... :
CCDS62 VYKSEFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKLQYGDPY
570 580 590 600 610
870 880 890 900 910 920
pF1KB3 IGKTVTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---YKFCKIR
. : . :: : .:..: .::.. : :. : .: :
CCDS62 YSYL-----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKFKCVCIT
620 630 640 650
930 940 950 960 970 980
pF1KB3 VRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLI
.: : : ::::::::::::: . . :::::: :..:::..:::..::::::: ::
CCDS62 MRVPRNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRMTIGMLI
660 670 680 690 700 710
990 1000 1010 1020 1030
pF1KB3 ECLQGKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITS
: . :: .: .: ::::: .. .. ....:. ::.. :.: ::.:..: .. .
CCDS62 ESMAGKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGISGLELEA
720 730 740 750 760 770
1040 1050 1060 1070 1080 1090
pF1KB3 QIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGA
.:::: .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: .:::.
CCDS62 DIFIGVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDALLAHGT
780 790 800 810 820 830
1100 1110 1120 1130 1140
pF1KB3 AQFLRERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNKTQISLV
. .:..:::. :: .::: :: . . . :.. :.: : . :. :
CCDS62 SFLLHDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRSDTIDTV
840 850 860 870 880 890
1150 1160 1170
pF1KB3 RMPYACKLLFQELMSMSIAPRMMSV
.::. . . :: .:.: ..
CCDS62 SVPYVFRYFVAELAAMNIKVKLDVV
900 910 920
>>CCDS62989.1 POLR1B gene_id:84172|Hs108|chr2 (952 aa)
initn: 1158 init1: 368 opt: 416 Z-score: 501.4 bits: 104.4 E(32554): 1.3e-21
Smith-Waterman score: 1115; 38.5% identity (62.5% similar) in 538 aa overlap (654-1171:441-949)
630 640 650 660 670 680
pF1KB3 PLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQ
:.: : : : : :.:. . .:. :..
CCDS62 EVVLIPMTGKPSLYPGLFLFTTPCRLVRPVQNL-ALGKEELIGTMEQIFMNVAIFEDEV-
420 430 440 450 460
690 700 710 720 730 740
pF1KB3 EKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVR
. .. :: :. : .:.: :..::: :::::::: :: ::::.:: . ... :
CCDS62 -----FAGVTTHQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDR
470 480 490 500 510 520
750 760 770 780 790 800
pF1KB3 MDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDR
:. . : ::.::: ..: . . : : :.:::. :::::..::..:.:... .:
CCDS62 SDNKLYRLQTPQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWER
530 540 550 560 570 580
810 820 830 840 850 860
pF1KB3 GFFRSVFYRS--YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRV
:: .. :.: .:. : :. :: :: . .::::::: :...
CCDS62 GFAHGSVYKSEFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKL
590 600 610 620 630
870 880 890 900 910
pF1KB3 SGDDVIIGKTVTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---Y
. : . : . :: : .:..: .::.. : :. : .
CCDS62 QYGDPYYSYL-----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKF
640 650 660 670 680
920 930 940 950 960 970
pF1KB3 KFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRM
: : .: : : ::::::::::::: . . :::::: :..:::..:::..::::
CCDS62 KCVCITMRVPRNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRM
690 700 710 720 730 740
980 990 1000 1010 1020 1030
pF1KB3 TIGHLIECLQGKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFT
::: ::: . :: .: .: ::::: .. .. ....:. ::.. :.: ::.:..
CCDS62 TIGMLIESMAGKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGIS
750 760 770 780 790 800
1040 1050 1060 1070 1080 1090
pF1KB3 GRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDC
: .. ..:::: .:::::.:::.::.. :. : . .. ::. ::. .::.::::::::
CCDS62 GLELEADIFIGVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDA
810 820 830 840 850 860
1100 1110 1120 1130 1140
pF1KB3 QIAHGAAQFLRERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNK
.:::.. .:..:::. :: .::: :: . . . :.. :.: : .
CCDS62 LLAHGTSFLLHDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRS
870 880 890 900 910 920
1150 1160 1170
pF1KB3 TQISLVRMPYACKLLFQELMSMSIAPRMMSV
:. : .::. . . :: .:.: ..
CCDS62 DTIDTVSVPYVFRYFVAELAAMNIKVKLDVV
930 940 950
>>CCDS46395.1 POLR1B gene_id:84172|Hs108|chr2 (1079 aa)
initn: 1234 init1: 368 opt: 416 Z-score: 500.5 bits: 104.5 E(32554): 1.5e-21
Smith-Waterman score: 1368; 30.0% identity (56.4% similar) in 1080 aa overlap (146-1171:75-1076)
120 130 140 150 160 170
pF1KB3 RNLTYSAPLYVDITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELN
: :.: .:::..: : : .: . : : .
CCDS46 SFNYAVHEGLGLAVQADINWAVNGISKGIIKQFLGYVPIMVKSKLCNLRNLPPQALIEHH
50 60 70 80 90 100
180 190 200 210 220 230
pF1KB3 ECPLDPGGYFIINGSEKV--LIAQEKMATNTVYVFAKKDSK---YAYTGECRSCLENSSR
: . :::::::: ::: .. . . ... : .. :. : :...
CCDS46 EEAEEMGGYFIINGIEKVIRMLIMPRRNFPIAMIRPKWKTRGPGYTQYGVSMHCVREEHS
110 120 130 140 150 160
240 250 260 270 280
pF1KB3 PTSTIWVSMLARGGQGAKKSAIGQRIVATLPYIKQE--VPIIIVFRALGFVSDRDILEHI
.. . . .: : .. .. : :. .:. ....:: :: .:....
CCDS46 AVN-MNLHYLENG-----------TVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQEL
170 180 190 200 210
290 300 310 320 330 340
pF1KB3 IYDFEDPEMM-----EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEV
: :: .. .:.. ..:. :.: .::..: .: .: . : :
CCDS46 IKGKEDDSFLRNSVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEF
220 230 240 250 260 270
350 360 370 380 390 400
pF1KB3 LQKEMLPHVGVSDFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAF
: .. . . .:.: :.: :...:. : :. :. : :... : :. .
CCDS46 LFNQC---ICIHLKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLM
280 290 300 310 320
410 420 430 440 450
pF1KB3 LFRGMFKNLLKEVRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQ
... ... : ..: .: .. . ... ::.. :. .: .:::: ..
CCDS46 FLKEKLEGWLVSIKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSK
330 340 350 360 370 380
460 470 480 490 500 510
pF1KB3 KKAHQAR-AGVSQVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPA
. .:. : ..:.: :::.: .. : : .:. :.: ::..::.
CCDS46 TGLGLLQDSGLCVVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPV
390 400 410 420 430 440
520 530 540 550 560 570
pF1KB3 ETPEGHAVGLVKNL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNG
.::.:. ::...: :. .. . : .: . .. .. . .. ....:
CCDS46 HTPDGEPCGLMNHLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDG
450 460 470 480 490 500
580 590 600 610 620
pF1KB3 CWVG-IHKD-PEQLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRI
:: . :: . ..::. ::.. :.... .. .. . ..: :.
CCDS46 VMVGWVDKDLAPGIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRL
510 520 530 540 550 560
630 640 650 660 670 680
pF1KB3 CRPLLIVEKQKLLLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDD
::. :.: : :. : : :.:. . .:. :.
CCDS46 VRPV-----QNLALGKE------------------------ELIGTMEQIFMNVAIFEDE
570 580 590
690 700 710 720 730 740
pF1KB3 LQEKEVAYCSTYTHCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFH
. . .. :: :. : .:.: :..::: :::::::: :: ::::.:: . ...
CCDS46 V------FAGVTTHQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQ
600 610 620 630 640
750 760 770 780 790 800
pF1KB3 VRMDTLAHVLYYPQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAV
: :. . : ::.::: ..: . . : : :.:::. :::::..::..:.:...
CCDS46 DRSDNKLYRLQTPQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASW
650 660 670 680 690 700
810 820 830 840 850
pF1KB3 DRGFFRSVFYRS--YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGV
.::: .. :.: .:. : :. :: :: . .::::::: :.
CCDS46 ERGFAHGSVYKSEFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGA
710 720 730 740 750 760
860 870 880 890 900 910
pF1KB3 RVSGDDVIIGKTVTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG--
... : . : . :: : .:..: .::.. : :. :
CCDS46 KLQYGDPYYSYL-----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSG
770 780 790 800
920 930 940 950 960 970
pF1KB3 -YKFCKIRVRSVRIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPS
.: : .: : : ::::::::::::: . . :::::: :..:::..:::..::
CCDS46 KFKCVCITMRVPRNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPS
810 820 830 840 850 860
980 990 1000 1010 1020 1030
pF1KB3 RMTIGHLIECLQGKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNG
::::: ::: . :: .: .: ::::: .. .. ....:. ::.. :.: ::.:
CCDS46 RMTIGMLIESMAGKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSG
870 880 890 900 910 920
1040 1050 1060 1070 1080 1090
pF1KB3 FTGRKITSQIFIGPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMER
..: .. ..:::: .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::
CCDS46 ISGLELEADIFIGVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMER
930 940 950 960 970 980
1100 1110 1120 1130 1140
pF1KB3 DCQIAHGAAQFLRERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCR
: .:::.. .:..:::. :: .::: :: . . . :.. :.: :
CCDS46 DALLAHGTSFLLHDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCS
990 1000 1010 1020 1030 1040
1150 1160 1170
pF1KB3 NKTQISLVRMPYACKLLFQELMSMSIAPRMMSV
. :. : .::. . . :: .:.: ..
CCDS46 RSDTIDTVSVPYVFRYFVAELAAMNIKVKLDVV
1050 1060 1070
>>CCDS2097.1 POLR1B gene_id:84172|Hs108|chr2 (1135 aa)
initn: 1234 init1: 368 opt: 416 Z-score: 500.1 bits: 104.5 E(32554): 1.5e-21
Smith-Waterman score: 1397; 29.1% identity (55.6% similar) in 1188 aa overlap (39-1171:38-1132)
10 20 30 40 50 60
pF1KB3 QYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVEDAPPIDLQ
:.: ...::. .. .. :. ::...
CCDS20 RNLPSGPSLKHLTDPSYGIPREQQKAALQELTRAHVESFNYAVHEGLGLAVQAIPPFEFA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 AEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERD-GAPSPMMPNEARLRNLTYSAPLYVD
. .. : . . .: :: . . ..: : : : :: . : .:
CCDS20 FKDERISFTILD----------AVISPPTVPKGTICKEANVYPAECRGRRSTYRGKLTAD
70 80 90 100 110
130 140 150 160 170 180
pF1KB3 ITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLDPGGYFII
:. .: .: .. : :.: .:::..: : : .: . : : .: . ::::::
CCDS20 INWAV--NG---ISKGIIKQFLGYVPIMVKSKLCNLRNLPPQALIEHHEEAEEMGGYFII
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB3 NGSEKV--LIAQEKMATNTVYVFAKKDSK---YAYTGECRSCLENSSRPTSTIWVSMLAR
:: ::: .. . . ... : .. :. : :... .. . . .:
CCDS20 NGIEKVIRMLIMPRRNFPIAMIRPKWKTRGPGYTQYGVSMHCVREEHSAVN-MNLHYLEN
180 190 200 210 220 230
250 260 270 280 290
pF1KB3 GGQGAKKSAIGQRIVATLPYIKQE--VPIIIVFRALGFVSDRDILEHIIYDFEDPEMM--
: .. .. : :. .:. ....:: :: .:....: :: ..
CCDS20 G-----------TVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQELIKGKEDDSFLRN
240 250 260 270 280
300 310 320 330 340 350
pF1KB3 ---EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEVLQKEMLPHVGVS
.:.. ..:. :.: .::..: .: .: . : : : .. . .
CCDS20 SVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEFLFNQC---ICIH
290 300 310 320 330
360 370 380 390 400 410
pF1KB3 DFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKE
.:.: :.: :...:. : :. :. : :... : :. .... ... :
CCDS20 LKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLMFLKEKLEGWLVS
340 350 360 370 380 390
420 430 440 450 460
pF1KB3 VRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQKKAHQAR-AGVS
..: .: .. . ... ::.. :. .: .:::: .. . .:.
CCDS20 IKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSKTGLGLLQDSGLC
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB3 QVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPAETPEGHAVGLVK
: ..:.: :::.: .. : : .:. :.: ::..::..::.:. ::..
CCDS20 VVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPVHTPDGEPCGLMN
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB3 NL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVG-IHKD-PE
.: :. .. . : .: . .. .. . .. ....: :: . ::
CCDS20 HLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDGVMVGWVDKDLAP
520 530 540 550 560 570
590 600 610 620 630
pF1KB3 QLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKL
. ..::. ::.. :.... .. .. . ..: :. ::. :.:
CCDS20 GIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRLVRPV-----QNL
580 590 600 610 620
640 650 660 670 680 690
pF1KB3 LLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTY
: :. : : :.:. . .:. :.. . ..
CCDS20 ALGKE------------------------ELIGTMEQIFMNVAIFEDEV------FAGVT
630 640 650
700 710 720 730 740 750
pF1KB3 THCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYY
:: :. : .:.: :..::: :::::::: :: ::::.:: . ... : :. . :
CCDS20 THQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDRSDNKLYRLQT
660 670 680 690 700 710
760 770 780 790 800 810
pF1KB3 PQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRS
::.::: ..: . . : : :.:::. :::::..::..:.:... .::: .. :.:
CCDS20 PQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWERGFAHGSVYKS
720 730 740 750 760 770
820 830 840 850 860 870
pF1KB3 --YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKT
.:. : :. :: :: . .::::::: :.... : .
CCDS20 EFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKLQYGDPYYSYL
780 790 800 810 820
880 890 900 910 920
pF1KB3 VTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---YKFCKIRVRSV
: . :: : .:..: .::.. : :. : .: : .:
CCDS20 -----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKFKCVCITMRVP
830 840 850 860 870
930 940 950 960 970 980
pF1KB3 RIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQ
: : ::::::::::::: . . :::::: :..:::..:::..::::::: ::: .
CCDS20 RNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRMTIGMLIESMA
880 890 900 910 920 930
990 1000 1010 1020 1030 1040
pF1KB3 GKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFI
:: .: .: ::::: .. .. ....:. ::.. :.: ::.:..: .. ..:::
CCDS20 GKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGISGLELEADIFI
940 950 960 970 980 990
1050 1060 1070 1080 1090 1100
pF1KB3 GPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFL
: .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: .:::.. .:
CCDS20 GVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDALLAHGTSFLL
1000 1010 1020 1030 1040 1050
1110 1120 1130 1140 1150
pF1KB3 RERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNKTQISLVRMPY
..:::. :: .::: :: . . . :.. :.: : . :. : .::
CCDS20 HDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRSDTIDTVSVPY
1060 1070 1080 1090 1100 1110
1160 1170
pF1KB3 ACKLLFQELMSMSIAPRMMSV
. . . :: .:.: ..
CCDS20 VFRYFVAELAAMNIKVKLDVV
1120 1130
>>CCDS62988.1 POLR1B gene_id:84172|Hs108|chr2 (1173 aa)
initn: 1234 init1: 368 opt: 416 Z-score: 499.9 bits: 104.5 E(32554): 1.6e-21
Smith-Waterman score: 1397; 29.1% identity (55.6% similar) in 1188 aa overlap (39-1171:76-1170)
10 20 30 40 50 60
pF1KB3 QYDEDDDEITPDLWQEACWIVISSYFDEKGLVRQQLDSFDEFIQMSVQRIVEDAPPIDLQ
:.: ...::. .. .. :. ::...
CCDS62 RNLPSGPSLKHLTDPSYGIPREQQKAALQELTRAHVESFNYAVHEGLGLAVQAIPPFEFA
50 60 70 80 90 100
70 80 90 100 110 120
pF1KB3 AEAQHASGEVEEPPRYLLKFEQIYLSKPTHWERD-GAPSPMMPNEARLRNLTYSAPLYVD
. .. : . . .: :: . . ..: : : : :: . : .:
CCDS62 FKDERISFTILD----------AVISPPTVPKGTICKEANVYPAECRGRRSTYRGKLTAD
110 120 130 140 150
130 140 150 160 170 180
pF1KB3 ITKTVIKEGEEQLQTQHQKTFIGKIPIMLRSTYCLLNGLTDRDLCELNECPLDPGGYFII
:. .: .: .. : :.: .:::..: : : .: . : : .: . ::::::
CCDS62 INWAV--NG---ISKGIIKQFLGYVPIMVKSKLCNLRNLPPQALIEHHEEAEEMGGYFII
160 170 180 190 200 210
190 200 210 220 230 240
pF1KB3 NGSEKV--LIAQEKMATNTVYVFAKKDSK---YAYTGECRSCLENSSRPTSTIWVSMLAR
:: ::: .. . . ... : .. :. : :... .. . . .:
CCDS62 NGIEKVIRMLIMPRRNFPIAMIRPKWKTRGPGYTQYGVSMHCVREEHSAVN-MNLHYLEN
220 230 240 250 260
250 260 270 280 290
pF1KB3 GGQGAKKSAIGQRIVATLPYIKQE--VPIIIVFRALGFVSDRDILEHIIYDFEDPEMM--
: .. .. : :. .:. ....:: :: .:....: :: ..
CCDS62 G-----------TVMLNFIYRKELFFLPLGFALKALVSFSDYQIFQELIKGKEDDSFLRN
270 280 290 300 310
300 310 320 330 340 350
pF1KB3 ---EMVKPSLDEAFVIQEQNVALNFIGS-RGAKPGVTKEKRIKYAKEVLQKEMLPHVGVS
.:.. ..:. :.: .::..: .: .: . : : : .. . .
CCDS62 SVSQMLRIVMEEGCSTQKQ--VLNYLGECFRVKLNVPDWYPNEQAAEFLFNQC---ICIH
320 330 340 350 360 370
360 370 380 390 400 410
pF1KB3 DFCETKKAYFLGYMVHRLLLAALGRRELDDRDHYGNKRLDLAGPLLAFLFRGMFKNLLKE
.:.: :.: :...:. : :. :. : :... : :. .... ... :
CCDS62 LKSNTEKFYMLCLMTRKLFALAKGECMEDNPDSLVNQEVLTPGQLFLMFLKEKLEGWLVS
380 390 400 410 420 430
420 430 440 450 460
pF1KB3 VRIYAQKFIDRGKDFNLELAIKTRIISDGL------KYSLATGNWGDQKKAHQAR-AGVS
..: .: .. . ... ::.. :. .: .:::: .. . .:.
CCDS62 IKIAFDKKAQK-TSVSMNTDNLMRIFTMGIDLTKPFEYLFATGNLRSKTGLGLLQDSGLC
440 450 460 470 480 490
470 480 490 500 510 520
pF1KB3 QVLNRLTFASTLSHLRRLNSPIGRD-GKLAKP--RQLHNTLWGMVCPAETPEGHAVGLVK
: ..:.: :::.: .. : : .:. :.: ::..::..::.:. ::..
CCDS62 VVADKLNFIRYLSHFRCVHR--GADFAKMRTTTVRRLLPESWGFLCPVHTPDGEPCGLMN
500 510 520 530 540 550
530 540 550 560 570 580
pF1KB3 NL-ALMAYISVGSQPSPILEFLEEWSMENLEEISPAAIADATKIFVNGCWVG-IHKD-PE
.: :. .. . : .: . .. .. . .. ....: :: . ::
CCDS62 HLTAVCEVVTQFVYTASIPALLCNLGVTPIDGAPHRSYSECYPVLLDGVMVGWVDKDLAP
560 570 580 590 600 610
590 600 610 620 630
pF1KB3 QLMNTLRK---LRRQ-----MDIIVSEVSMIRDIREREIRIYTDAGRICRPLLIVEKQKL
. ..::. ::.. :.... .. .. . ..: :. ::. :.:
CCDS62 GIADSLRHFKVLREKRIPPWMEVVLIPMTGKPSLYPG-LFLFTTPCRLVRPV-----QNL
620 630 640 650 660
640 650 660 670 680 690
pF1KB3 LLKKRHIDQLKEREYNNYSWQDLVASGVVEYIDTLEEETVMLAMTPDDLQEKEVAYCSTY
: :. : : :.:. . .:. :.. . ..
CCDS62 ALGKE------------------------ELIGTMEQIFMNVAIFEDEV------FAGVT
670 680 690
700 710 720 730 740 750
pF1KB3 THCEIHPSMILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGVYITNFHVRMDTLAHVLYY
:: :. : .:.: :..::: :::::::: :: ::::.:: . ... : :. . :
CCDS62 THQELFPHSLLSVIANFIPFSDHNQSPRNMYQCQMGKQTMGFPLLTYQDRSDNKLYRLQT
700 710 720 730 740 750
760 770 780 790 800 810
pF1KB3 PQKPLVTTRSMEYLRFRELPAGINSIVAIASYTGYNQEDSVIMNRSAVDRGFFRSVFYRS
::.::: ..: . . : : :.:::. :::::..::..:.:... .::: .. :.:
CCDS62 PQSPLVRPSMYDYYDMDNYPIGTNAIVAVISYTGYDMEDAMIVNKASWERGFAHGSVYKS
760 770 780 790 800 810
820 830 840 850 860 870
pF1KB3 --YKEQESKKGFDQEEVFE-KPTRETCQGMRHAIYDKLDDDGLIAPGVRVSGDDVIIGKT
.:. : :. :: :: . .::::::: :.... : .
CCDS62 EFIDLSEKIKQGDSSLVFGIKPGDPR-------VLQKLDDDGLPFIGAKLQYGDPYYSYL
820 830 840 850 860
880 890 900 910 920
pF1KB3 VTLPENEDELESTNRRY-TKRDCSTFLRTSETGIVDQVMVTLNQEG---YKFCKIRVRSV
: . :: : .:..: .::.. : :. : .: : .:
CCDS62 -----NLNTGESFVMYYKSKENC----------VVDNIKVCSNDTGSGKFKCVCITMRVP
870 880 890 900 910
930 940 950 960 970 980
pF1KB3 RIPQIGDKFASRHGQKGTCGIQYRQEDMPFTCEGITPDIIINPHAIPSRMTIGHLIECLQ
: : ::::::::::::: . . :::::: :..:::..:::..::::::: ::: .
CCDS62 RNPTIGDKFASRHGQKGILSRLWPAEDMPFTESGMVPDILFNPHGFPSRMTIGMLIESMA
920 930 940 950 960 970
990 1000 1010 1020 1030 1040
pF1KB3 GKVSANKGEIGDATPF---NDAVNVQKISNLLSDYGYHLRGNEVLYNGFTGRKITSQIFI
:: .: .: ::::: .. .. ....:. ::.. :.: ::.:..: .. ..:::
CCDS62 GKSAALHGLCHDATPFIFSEENSALEYFGEMLKAAGYNFYGTERLYSGISGLELEADIFI
980 990 1000 1010 1020 1030
1050 1060 1070 1080 1090 1100
pF1KB3 GPTYYQRLKHMVDDKIHSRARGPIQILNRQPMEGRSRDGGLRFGEMERDCQIAHGAAQFL
: .:::::.:::.::.. :. : . .. ::. ::. .::.:::::::: .:::.. .:
CCDS62 GVVYYQRLRHMVSDKFQVRTTGARDRVTNQPIGGRNVQGGIRFGEMERDALLAHGTSFLL
1040 1050 1060 1070 1080 1090
1110 1120 1130 1140 1150
pF1KB3 RERLFEASDPYQVHVCNLCGIM----------AIANTRTHTYECRGCRNKTQISLVRMPY
..:::. :: .::: :: . . . :.. :.: : . :. : .::
CCDS62 HDRLFNCSDRSVAHVCVKCGSLLSPLLEKPPPSWSAMRNRKYNCTLCSRSDTIDTVSVPY
1100 1110 1120 1130 1140 1150
1160 1170
pF1KB3 ACKLLFQELMSMSIAPRMMSV
. . . :: .:.: ..
CCDS62 VFRYFVAELAAMNIKVKLDVV
1160 1170
1174 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 13:40:43 2016 done: Thu Nov 3 13:40:43 2016
Total Scan time: 3.970 Total Display time: 0.520
Function used was FASTA [36.3.4 Apr, 2011]