FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2312, 2136 aa
1>>>pF1KE2312 2136 - 2136 aa - 2136 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.5076+/-0.00145; mu= 19.2170+/- 0.088
mean_var=87.8162+/-17.954, 0's: 0 Z-trim(100.0): 39 B-trim: 52 in 1/48
Lambda= 0.136863
statistics sampled from 5901 (5928) to 5901 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.503), E-opt: 0.2 (0.182), width: 16
Scan time: 5.630
The best scores are: opt bits E(32554)
CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136) 14015 2779.1 0
CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202) 5032 1005.3 0
CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435) 1119 232.7 9.2e-60
CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 ( 731) 1043 217.5 1.7e-55
>>CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136 aa)
initn: 14015 init1: 14015 opt: 14015 Z-score: 14945.2 bits: 2779.1 E(32554): 0
Smith-Waterman score: 14015; 100.0% identity (100.0% similar) in 2136 aa overlap (1-2136:1-2136)
10 20 30 40 50 60
pF1KE2 MADVTARSLQYEYKANSNLVLQADRSLIDRTRRDEPTGEVLSLVGKLEGTRMGDKAQRTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 MADVTARSLQYEYKANSNLVLQADRSLIDRTRRDEPTGEVLSLVGKLEGTRMGDKAQRTK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 PQMQEERRAKRRKRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 PQMQEERRAKRRKRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 QAALGDQPRDILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 QAALGDQPRDILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKIT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 DYGGDKEIQNMDDNIDETYGVNVQFESDEEEGDEDVYGEVREEASDDDMEGDEAVVRCTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 DYGGDKEIQNMDDNIDETYGVNVQFESDEEEGDEDVYGEVREEASDDDMEGDEAVVRCTL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 SANLVASGELMSSKKKDLHPRDIDAFWLQRQLSRFYDDAIVSQKKADEVLEILKTASDDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 SANLVASGELMSSKKKDLHPRDIDAFWLQRQLSRFYDDAIVSQKKADEVLEILKTASDDR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 ECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEKERIMGKMEADPELSKFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 ECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEKERIMGKMEADPELSKFL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 YQLHETEKEDLIREERSRRERVRQSRMDTDLETMDLDQGGEALAPRQVLDLEDLVFTQGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 YQLHETEKEDLIREERSRRERVRQSRMDTDLETMDLDQGGEALAPRQVLDLEDLVFTQGS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 HFMANKRCQLPDGSFRRQRKGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 HFMANKRCQLPDGSFRRQRKGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKT
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 LNRIQSKLYRAALETDENLLLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 LNRIQSKLYRAALETDENLLLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIY
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 IAPMRSLVQEMVGSFGKRLATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 IAPMRSLVQEMVGSFGKRLATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 GERTYTQLVRLIILDEIHLLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 GERTYTQLVRLIILDEIHLLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYED
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 VATFLRVDPAKGLFYFDNSFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEHAGKNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 VATFLRVDPAKGLFYFDNSFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEHAGKNQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 VLVFVHSRKETGKTARAIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 VLVFVHSRKETGKTARAIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPY
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 GFAIHHAGMTRVDRTLVEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 GFAIHHAGMTRVDRTLVEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGR
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 WTELGALDILQMLGRAGRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 WTELGALDILQMLGRAGRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDM
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 LNAEIVLGNVQNAKDAVNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 LNAEIVLGNVQNAKDAVNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTA
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 ALMLDKNNLVKYDKKTGNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 ALMLDKNNLVKYDKKTGNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSL
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 SSEFKNITVREEEKLELQKLLERVPIPVKESIEEPSAKINVLLQAFISQLKLEGFALMAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 SSEFKNITVREEEKLELQKLLERVPIPVKESIEEPSAKINVLLQAFISQLKLEGFALMAD
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 MVYVTQSAGRLMRAIFEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 MVYVTQSAGRLMRAIFEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVV
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 KKIEKKNFPFERLYDLNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 KKIEKKNFPFERLYDLNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKV
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 ELTITPDFQWDEKVHGSSEAFWILVEDVDSEVILHHEYFLLKAKYAQDEHLITFFVPVFE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 ELTITPDFQWDEKVHGSSEAFWILVEDVDSEVILHHEYFLLKAKYAQDEHLITFFVPVFE
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE2 PLPPQYFIRVVSDRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 PLPPQYFIRVVSDRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESL
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 YQDKFPFFNPIQTQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 YQDKFPFFNPIQTQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYIT
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE2 PMEALAEQVYMDWYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 PMEALAEQVYMDWYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWK
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE2 QRKNVQNINLFVVDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 QRKNVQNINLFVVDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDV
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE2 AHWLGCSATSTFNFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 AHWLGCSATSTFNFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVI
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE2 VFVPSRKQTRLTAIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 VFVPSRKQTRLTAIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYL
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE2 HEGLSPMERRLVEQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 HEGLSPMERRLVEQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYP
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE2 IYDVLQMVGHANRPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 IYDVLQMVGHANRPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEI
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE2 VTKTIENKQDAVDYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 VTKTIENKQDAVDYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSK
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE2 CISIEDEMDVAPLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 CISIEDEMDVAPLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPI
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE2 RHHEDNLLRQLAQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSAELQSDTEEILSKAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 RHHEDNLLRQLAQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSAELQSDTEEILSKAI
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE2 RLIQACVDVLSSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHIKRCTDKGVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 RLIQACVDVLSSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHIKRCTDKGVE
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE2 SVFDIMEMEDEERNALLQLTDSQIADVARFCNRYPNIELSYEVVDKDSIRSGGPVVVLVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 SVFDIMEMEDEERNALLQLTDSQIADVARFCNRYPNIELSYEVVDKDSIRSGGPVVVLVQ
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE2 LEREEEVTGPVIAPLFPQKREEGWWVVIGDAKSNSLISIKRLTLQQKAKVKLDFVAPATG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS20 LEREEEVTGPVIAPLFPQKREEGWWVVIGDAKSNSLISIKRLTLQQKAKVKLDFVAPATG
2050 2060 2070 2080 2090 2100
2110 2120 2130
pF1KE2 AHNYTLYFMSDAYMGCDQEYKFSVDVKEAETDSDSD
::::::::::::::::::::::::::::::::::::
CCDS20 AHNYTLYFMSDAYMGCDQEYKFSVDVKEAETDSDSD
2110 2120 2130
>>CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202 aa)
initn: 4459 init1: 1694 opt: 5032 Z-score: 5359.1 bits: 1005.3 E(32554): 0
Smith-Waterman score: 5145; 40.4% identity (70.3% similar) in 2126 aa overlap (103-2114:60-2167)
80 90 100 110 120 130
pF1KE2 KRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFIQAALG-DQPRD-
: : . : . .: . .: :. :.
CCDS50 KIKRSKLHEQVLDLGLTWKKIIKFLNEKLEKSKMQSINEDLKDILHAAKQIVGTDNGREA
30 40 50 60 70 80
140 150 160 170 180 190
pF1KE2 ILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKITDYGGDKEIQN
: ::: .. .... :: : : ..: .. . : ..: .. .. ..
CCDS50 IESGAAFLFMTFHLKDSVGHKET-KAIKQMFGPFPSSSATAACNATNRIISHFSQDDLTA
90 100 110 120 130 140
200 210 220 230 240
pF1KE2 M-----DDNIDETY-GVNVQFESDEEEGDE----DVYGEVREEASDDDMEGDEAVVRCTL
. .. :... : :. : : .. :. . ::... : : . :
CCDS50 LVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFDELPINGETQKTISLD--------YKKFL
150 160 170 180 190 200
250 260 270 280 290
pF1KE2 SANLVASGELMSSKKKDLHPRDIDAFW--LQRQLSRFYDDAIVSQKKAD---EVLEILKT
. .: : . . : .. . . .: ... :. . . : . ..: .
CCDS50 NEHL---QEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTEVPRVEDLCCTLYDMLAS
210 220 230 240 250
300 310 320 330 340 350
pF1KE2 ASDDRECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEK-----ERIMGKM
.. : ...: ::: . ...:. : :.:. :. : .: . . . ..:.:.
CCDS50 IKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSNDHRFQALQDNCKKILGE-
260 270 280 290 300 310
360 370 380 390
pF1KE2 EADPELSKFLYQLHETEKEDLIREERSRRERV--RQSRMDTDLET----MDLD------Q
.: :. . . : ::. :... : ...:. :... :::. : .: :
CCDS50 NAKPNYGCQVTIQSEQEKQ-LMKQYRREEKRIARREKKAGEDLEVSEGLMCFDPKELRIQ
320 330 340 350 360 370
400 410 420 430
pF1KE2 GGEAL-----AP---RQV-LDLEDLVF-----TQG-----SHFMANKRCQLPDGSFRRQR
.:: .: :: :.: . . .:. : :.:. . ::.: :..
CCDS50 REQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIAGAKMILPEGIQRENN
380 390 400 410 420 430
440 450 460 470 480 490
pF1KE2 KGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENL
: ::::..: .: :.. ::. . .. : . .: .:.:.: :::::: ....: .:.::.
CCDS50 KLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRIQSIVFETAYNTNENM
440 450 460 470 480 490
500 510 520 530 540 550
pF1KE2 LLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRL
:.::::::::::.:.. .:.:: .:... :.:. ..:::.:.:::..:. ::. :..::
CCDS50 LICAPTGAGKTNIAMLTVLHEIRQHFQQ-GVIKKNEFKIVYVAPMKALAAEMTDYFSRRL
500 510 520 530 540 550
560 570 580 590 600 610
pF1KE2 ATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG-GERTYTQLVRLIILDEIH
:: : ::::: :: : :: ::..: ::::::..:::. :. . .:.:::.::::.:
CCDS50 EPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVALSQIVRLLILDEVH
560 570 580 590 600 610
620 630 640 650 660 670
pF1KE2 LLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYEDVATFLRVDPAKGLFYFDN
:::.:::::::..:::..:..: :: .:..::::::::: ::::::.:.: :::.::.
CCDS50 LLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATFLHVNPYIGLFFFDG
620 630 640 650 660 670
680 690 700 710 720 730
pF1KE2 SFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEH--AGKNQVLVFVHSRKETGKTAR
:::::: ::..:: . ..... :.:. ::..... :: .::.::::.:. : .::
CCDS50 RFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAG-HQVMVFVHARNATVRTAM
680 690 700 710 720 730
740 750 760 770 780 790
pF1KE2 AIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHAGMTRVDRTL
.. . . . .:. . . . . .... .: ....:.: ::.:::::: : ::.:
CCDS50 SLIERAKNCGHIPFFFPTQGHDYVLAEKQVQRSRNKQVRELFPDGFSIHHAGMLRQDRNL
740 750 760 770 780 790
800 810 820 830 840 850
pF1KE2 VEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGRWTELGALDILQMLGRA
::.::.. ::.::: :::::::::::::.:::::::.:. ..: ...:: ::..:..:::
CCDS50 VENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVDLGILDVMQIFGRA
800 810 820 830 840 850
860 870 880 890 900 910
pF1KE2 GRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDMLNAEIVLGNVQNAKDA
::::.: ::::.::.: .:..::.::.:. :::::.. .: : :::::.::.: :...:
CCDS50 GRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNAEIALGTVTNVEEA
860 870 880 890 900 910
920 930 940 950 960 970
pF1KE2 VNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTAALMLDKNNLVKYDKKT
:.:..:.:::.:: .: ::::: . :: : ..: .:: .. ::: ........:
CCDS50 VKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRKLDKAQMIRFEERT
920 930 940 950 960 970
980 990 1000 1010 1020 1030
pF1KE2 GNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSLSSEFKNITVREEEKLE
: :. :.::: :::::: .:..:.:.:. .: ..: . : . :: .: ::::: :
CCDS50 GYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEEFDQIKVREEEIEE
980 990 1000 1010 1020 1030
1040 1050 1060 1070 1080 1090
pF1KE2 LQKLLERV-PIPVKESIEEPSAKINVLLQAFISQLKLEGFALMADMVYVTQSAGRLMRAI
:. :: . . ..:. .:::.:::..::. ....:.:..: .::.:.:.:..::.
CCDS50 LDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSAYVAQNAARIVRAL
1040 1050 1060 1070 1080 1090
1100 1110 1120 1130 1140 1150
pF1KE2 FEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVVKKIEKKNFPFERLYD
:::.: . : .: . ::: :.::::.: ::::: :: ... ..:.:.. ..: :
CCDS50 FEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTRLEEKKLTVDKLKD
1100 1110 1120 1130 1140 1150
1160 1170 1180 1190 1200 1210
pF1KE2 LNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKVELTITPDFQWDEKVH
. ..:::.... ..: ... :: .:.. . . .:::::..:.: :.: :: :...::
CCDS50 MRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTLSIYADFTWNDQVH
1160 1170 1180 1190 1200 1210
1220 1230 1240 1250 1260 1270
pF1KE2 GS-SEAFWILVEDVDSEVILHHEYFL-LKAKYAQDE-HLITFFVPVFEPLPPQYFIRVVS
:. .: .:: ::: .. : : :::: :: . . : .:..: .:.::::: ::.::.::
CCDS50 GTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIFEPLPSQYYIRAVS
1220 1230 1240 1250 1260 1270
1280 1290 1300 1310 1320 1330
pF1KE2 DRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESLYQDKFPFFNPIQ
::::. :. ..:.::::::..:: ::::::::::..:: .:.:.:: .: :::.:
CCDS50 DRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEALY--NFSHFNPVQ
1280 1290 1300 1310 1320 1330
1340 1350 1360 1370 1380 1390
pF1KE2 TQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYITPMEALAEQVYMD
::.:.:.:..: ::..:::::::::. ::.::.:.. . .. :::.:..::... . :
CCDS50 TQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAPLKALVRERMDD
1340 1350 1360 1370 1380 1390
1400 1410 1420 1430 1440 1450
pF1KE2 WYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWKQRKNVQNINLFV
: .....:.:::. :::... :.: ..:...:..:::::: .:: :..:. ::......
CCDS50 WKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQNRNYVQQVTILI
1400 1410 1420 1430 1440 1450
1460 1470 1480 1490 1500 1510
pF1KE2 VDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDVAHWLGCSATSTF
.::.::.: : ::::::: :: .:::. :.:.:::.::..:.::.:.: ::. . . :
CCDS50 IDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLADWLNIKQMGLF
1460 1470 1480 1490 1500 1510
1520 1530 1540 1550 1560 1570
pF1KE2 NFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVIVFVPSRKQTRLT
::.:.:::::::.::::: .: :. :: ::...:: .::: :::..:: ::.:::::
CCDS50 NFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLIFVSSRRQTRLT
1520 1530 1540 1550 1560 1570
1580 1590 1600 1610 1620 1630
pF1KE2 AIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYLHEGLSPMERRLV
:..... :.. . ...:. :... . . ::.:: :: :.:. : :: .:. :
CCDS50 ALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHHAGLHERDRKTV
1580 1590 1600 1610 1620 1630
1640 1650 1660 1670 1680 1690
pF1KE2 EQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYPIYDVLQMVGHAN
:.:: . .::..:. .: ::.: :::::: :.::.:: . :::.:: :::::.:.:.
CCDS50 EELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPITDVLQMMGRAG
1640 1650 1660 1670 1680 1690
1700 1710 1720 1730 1740 1750
pF1KE2 RPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEIVTKTIENKQDAV
:: ::.:. ::. . ::::.:::::::.:::: : . ::.::::. :: .::::.
CCDS50 RPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIAGGTITSKQDAL
1700 1710 1720 1730 1740 1750
1760 1770 1780 1790 1800 1810
pF1KE2 DYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSKCISI-EDEMDVA
::.:::...::. .::.:::: .:: .. ::.:.:..: .:: : :: : ::. ..
CCDS50 DYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYCIEIGEDNRSIE
1760 1770 1780 1790 1800 1810
1820 1830 1840 1850 1860 1870
pF1KE2 PLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPIRHHEDNLLRQL
::. : ::.:::... :...:. :. . ... :. :.:.: :: ..:.::.::.. .:
CCDS50 PLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPVRHNEDHMNSEL
1820 1830 1840 1850 1860 1870
1880 1890 1900 1910 1920 1930
pF1KE2 AQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSA-ELQSDTEEILSKAIRLIQACVDVL
:. .: . : .:..::.:..::::::::: .: . ..::. .:..:.:. :: .::
CCDS50 AKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQALRVCQAMLDVA
1880 1890 1900 1910 1920 1930
1940 1950 1960 1970 1980
pF1KE2 SSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHI----------KRCTDKGVE
...::: .: .: ::: :. : ::: : ::.. ..:. : .:
CCDS50 ANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKPIMKGPHARGRT
1940 1950 1960 1970 1980 1990
1990 2000 2010
pF1KE2 SVFDIMEM------EDEERNALLQ--LTDSQIADVARFCNRYPNI---------------
:. .. :. .:. ..... : .. .. : .. : :
CCDS50 SIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGISVKGSWDDLVE
2000 2010 2020 2030 2040 2050
2020 2030 2040 2050 2060
pF1KE2 ---ELSYEVVDKDS--------IRSGGPVVVLVQLER------EEEVTGPVIAPLFPQKR
::: .. :. ... :. :.:.: . . . ...: ::...
CCDS50 GHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPESCAVTPRFPKSK
2060 2070 2080 2090 2100 2110
2070 2080 2090 2100 2110
pF1KE2 EEGWWVVIGDAKSNSLISIKRLTLQQKAKV-KLDFVAPAT-GAHNYTLYFMSDAYMGCDQ
.:::....:.. . ::..::. .. .: .:.: .: : . :::::::: :.
CCDS50 DEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLYFMSDCYLGLDQ
2120 2130 2140 2150 2160 2170
2120 2130
pF1KE2 EYKFSVDVKEAETDSDSD
CCDS50 QYDIYLNVTQASLSAQVNTKVSDSLTDLALK
2180 2190 2200
>>CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435 aa)
initn: 706 init1: 247 opt: 1119 Z-score: 1186.4 bits: 232.7 E(32554): 9.2e-60
Smith-Waterman score: 1181; 31.5% identity (61.9% similar) in 867 aa overlap (415-1243:219-1054)
390 400 410 420 430 440
pF1KE2 SRMDTDLETMDLDQGGEALAPRQVLDLEDLVFTQGSHFMANKRCQLPDGSFRRQR--KGY
::: .. : :. .. .: :. ..
CCDS30 GSVKIVQTEMNKGKSRNYSNSKQKFQYSANVFTANNAFSAS---EIGEGMFKAPSFSVAF
190 200 210 220 230 240
450 460 470 480 490 500
pF1KE2 EEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENLLLC
. . . . .:: : : ..: .. :. : .: :::: . : ::.:...:
CCDS30 QPHDIQEVTENGLGS---LKAVTEIPAKFRSIFKEFPYFNYIQSKAFDDLLYTDRNFVIC
250 260 270 280 290 300
510 520 530 540 550 560
pF1KE2 APTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRLATY
::::.::: : . . : . :. . ..::.:.::...: .. .. ....
CCDS30 APTGSGKTVVFELAITRLL-----MEVPLPWLNIKIVYMAPIKALCSQRFDDWKEKFGPI
310 320 330 340 350
570 580 590 600 610 620
pF1KE2 GITVAELTGDHQLCKE-EISATQIIVCTPEKWDIITRKGGERTYTQLVRLIILDEIHLLH
:.. ::::: . ::. ..::. :::::: .::: . . .:::::...::.:...
CCDS30 GLNCKELTGDTVMDDLFEIQHAHIIMTTPEKWDSMTRKWRDNSLVQLVRLFLIDEVHIVK
360 370 380 390 400 410
630 640 650 660 670
pF1KE2 DD-RGPVLEALVAR--AIRNIEMTQED------VRLIGLSATLPNYEDVATFLRVD--PA
:. :::.::..:.: ..... .: .. .:....:::.:: ::.: .: ::
CCDS30 DENRGPTLEVVVSRMKTVQSVSQTLKNTSTAIPMRFVAVSATIPNAEDIAEWLSDGERPA
420 430 440 450 460 470
680 690 700 710 720
pF1KE2 KGLFYFDNSFRPVPLEQTYVGITEKKAIKRFQI---MNEIVYEKIMEHAGKNQVLVFVHS
: .:.: ::: :... .:. .. .:.. .: . :. .. .. .::: .
CCDS30 VCL-KMDESHRPVKLQKVVLGFPCSSNQTEFKFDLTLNYKIASVIQMYSDQKPTLVFCAT
480 490 500 510 520 530
730 740 750 760 770 780
pF1KE2 RKETGKTARAIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHA
:: . ..: . : ::. .. : . . :. : . .. .:.:.: : : :::
CCDS30 RKGVQQAASV-----LVKDAKFIMTVE---QKQRLQKYAYSVRDSKLRDILKDGAAYHHA
540 550 560 570 580
790 800 810 820 830 840
pF1KE2 GMTRVDRTLVEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGRWTELGAL
:: :: .:: :. . :: .:.::: ::::::: :.::.:. :. : . : .
CCDS30 GMELSDRKVVEGAFTVGDLPVLFTTSTLAMGVNLPAHLVVIKSTMHYA--GGLFEEYSET
590 600 610 620 630 640
850 860 870 880 890 900
pF1KE2 DILQMLGRAGRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDMLNAEIVL
:::::.:::::::.:: . ....: . . :...: . .::.. .: . :::::::
CCDS30 DILQMIGRAGRPQFDTTATAVIMTRLSTRDKYIQMLACRDTVESSLHRHLIEHLNAEIVL
650 660 670 680 690 700
910 920 930 940 950 960
pF1KE2 GNVQNAKDAVNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTAALMLDKN
.. ... ::.:. . :::: :..:. ::.. . :. : . . . .: :..
CCDS30 HTITDVNIAVEWIRSTLLYIRALKNPSHYGFA-SGLNKDGI-EAKLQELCLKNLNDLSSL
710 720 730 740 750 760
970 980 990 1000 1010 1020
pF1KE2 NLVKYDKKTGNFQVTELGRIASHYYITNDTVQTYNQLL-KPTLSEIELFRVFSLSSEFKN
.:.:.:. . ::. :: ::. . :::: .::. . . : ::: .: ... .:: .
CCDS30 DLIKMDEGV-NFKPTEAGRLMAWYYITFETVKKFYTISGKETLS--DLVTLIAGCKEFLD
770 780 790 800 810 820
1030 1040 1050 1060 1070 1080
pF1KE2 ITVREEEKLELQKLLE---RVPI--PVKESIEEPSAKINVLLQAFISQLKLEGFALMADM
: .: .:: :. : . :. : :.. :. :.: :.:: .. . .. ::: :
CCDS30 IQLRINEKKTLNTLNKDPNRITIRFPMEGRIKTREMKVNCLIQAQLGCIPIQDFALTQDT
830 840 850 860 870 880
1090 1100 1110 1120 1130
pF1KE2 VYVTQSAGRLMRAIFEIVL--NRGWAQLTDKTLNLCKMIDKRMWQ-SMCPLRQFRKLPEE
. . . ..:. : . ..: .. .: : . .: : : . ..:. :. .:..:.
CCDS30 AKIFRHGSRITRWLSDFVAAQEKKFAVLLN-SLILAKCFRCKLWENSLHVSKQLEKIGIT
890 900 910 920 930 940
1140 1150 1160 1170 1180 1190
pF1KE2 VVKKIEKKNFP-FERLYDLNHNEIGELI--RMPKMGKTIHKYVHLFPKLELSVHLQPITR
. . : . .. :... . . :. ::: : : .: :.. : .:: ::.: . :::
CCDS30 LSNAIVNAGLTSFKKIEETDAREL-ELILNRHPPFGTQIKETVMYLPKYELKV--EQITR
950 960 970 980 990
1200 1210 1220 1230 1240
pF1KE2 -STLKVELTITP---DFQWDEKVHGSSEAFWI--LVEDVDSEVILHHEY---FLLKAKYA
: .:. .: .:. . . .:.. .. .. :.:..:. :. ::::
CCDS30 YSDTTAEILVTVILRNFEQLQTKRTASDSHYVTLIIGDADNQVVYLHKITDSVLLKAGSW
1000 1010 1020 1030 1040 1050
1250 1260 1270 1280 1290 1300
pF1KE2 QDEHLITFFVPVFEPLPPQYFIRVVSDRWLSCETQLPVSFRHLILPEKYPPPTELLDLQP
CCDS30 AKKIAVKRALKSEDLSINLISSEFVGLDIQQKLTVFYLEPKRFGNQITMQRKSETQISHS
1060 1070 1080 1090 1100 1110
>>CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 (731 aa)
initn: 937 init1: 677 opt: 1043 Z-score: 1110.0 bits: 217.5 E(32554): 1.7e-55
Smith-Waterman score: 1070; 33.8% identity (62.5% similar) in 678 aa overlap (103-724:60-721)
80 90 100 110 120 130
pF1KE2 KRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFIQAALG-DQPRD-
: : . : . .: . .: :. :.
CCDS75 KIKRSKLHEQVLDLGLTWKKIIKFLNEKLEKSKMQSINEDLKDILHAAKQIVGTDNGREA
30 40 50 60 70 80
140 150 160 170 180 190
pF1KE2 ILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKITDYGGDKEIQN
: ::: .. .... :: : : ..: .. . : ..: .. .. ..
CCDS75 IESGAAFLFMTFHLKDSVGHKET-KAIKQMFGPFPSSSATAACNATNRIISHFSQDDLTA
90 100 110 120 130 140
200 210 220 230 240
pF1KE2 M-----DDNIDETY-GVNVQFESDEEEGDE----DVYGEVREEASDDDMEGDEAVVRCTL
. .. :... : :. : : .. :. . ::... : : . :
CCDS75 LVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFDELPINGETQKTISLD--------YKKFL
150 160 170 180 190 200
250 260 270 280 290
pF1KE2 SANLVASGELMSSKKKDLHPRDIDAFW--LQRQLSRFYDDAIVSQKKAD---EVLEILKT
. .: : . . : .. . . .: ... :. . . : . ..: .
CCDS75 NEHL---QEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTEVPRVEDLCCTLYDMLAS
210 220 230 240 250
300 310 320 330 340 350
pF1KE2 ASDDRECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEK-----ERIMGKM
.. : ...: ::: . ...:. : :.:. :. : .: . . . ..:.:.
CCDS75 IKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSNDHRFQALQDNCKKILGE-
260 270 280 290 300 310
360 370 380 390
pF1KE2 EADPELSKFLYQLHETEKEDLIREERSRRERV--RQSRMDTDLET----MDLD------Q
.: :. . . : ::. :... : ...:. :... :::. : .: :
CCDS75 NAKPNYGCQVTIQSEQEKQ-LMKQYRREEKRIARREKKAGEDLEVSEGLMCFDPKELRIQ
320 330 340 350 360 370
400 410 420 430
pF1KE2 GGEAL-----AP---RQV-LDLEDLVFT----------QGSHFMANKRCQLPDGSFRRQR
.:: .: :: :.: . . . : :.:. . ::.: :..
CCDS75 REQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIAGAKMILPEGIQRENN
380 390 400 410 420 430
440 450 460 470 480 490
pF1KE2 KGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENL
: ::::..: .: :.. ::. . .. : . .: .:.:.: :::::: ....: .:.::.
CCDS75 KLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRIQSIVFETAYNTNENM
440 450 460 470 480 490
500 510 520 530 540 550
pF1KE2 LLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRL
:.::::::::::.:.. .:.:: .:... :.:. ..:::.:.:::..:. ::. :..::
CCDS75 LICAPTGAGKTNIAMLTVLHEIRQHFQQ-GVIKKNEFKIVYVAPMKALAAEMTDYFSRRL
500 510 520 530 540 550
560 570 580 590 600 610
pF1KE2 ATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG-GERTYTQLVRLIILDEIH
:: : ::::: :: : :: ::..: ::::::..:::. :. . .:.:::.::::.:
CCDS75 EPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVALSQIVRLLILDEVH
560 570 580 590 600 610
620 630 640 650 660 670
pF1KE2 LLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYEDVATFLRVDPAKGLFYFDN
:::.:::::::..:::..:..: :: .:..::::::::: ::::::.:.: :::.::.
CCDS75 LLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATFLHVNPYIGLFFFDG
620 630 640 650 660 670
680 690 700 710 720 730
pF1KE2 SFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEH--AGKNQVLVFVHSRKETGKTAR
:::::: ::..:: . ..... :.:. ::..... :: .:: .:
CCDS75 RFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAG-HQVHLFYLLLHLFICF
680 690 700 710 720 730
740 750 760 770 780 790
pF1KE2 AIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHAGMTRVDRTL
2136 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 19:47:47 2016 done: Sun Nov 6 19:47:48 2016
Total Scan time: 5.630 Total Display time: 0.480
Function used was FASTA [36.3.4 Apr, 2011]