FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2312, 2136 aa 1>>>pF1KE2312 2136 - 2136 aa - 2136 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5076+/-0.00145; mu= 19.2170+/- 0.088 mean_var=87.8162+/-17.954, 0's: 0 Z-trim(100.0): 39 B-trim: 52 in 1/48 Lambda= 0.136863 statistics sampled from 5901 (5928) to 5901 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.503), E-opt: 0.2 (0.182), width: 16 Scan time: 5.630 The best scores are: opt bits E(32554) CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136) 14015 2779.1 0 CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202) 5032 1005.3 0 CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435) 1119 232.7 9.2e-60 CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 ( 731) 1043 217.5 1.7e-55 >>CCDS2020.1 SNRNP200 gene_id:23020|Hs108|chr2 (2136 aa) initn: 14015 init1: 14015 opt: 14015 Z-score: 14945.2 bits: 2779.1 E(32554): 0 Smith-Waterman score: 14015; 100.0% identity (100.0% similar) in 2136 aa overlap (1-2136:1-2136) 10 20 30 40 50 60 pF1KE2 MADVTARSLQYEYKANSNLVLQADRSLIDRTRRDEPTGEVLSLVGKLEGTRMGDKAQRTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 MADVTARSLQYEYKANSNLVLQADRSLIDRTRRDEPTGEVLSLVGKLEGTRMGDKAQRTK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 PQMQEERRAKRRKRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 PQMQEERRAKRRKRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 QAALGDQPRDILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 QAALGDQPRDILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKIT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DYGGDKEIQNMDDNIDETYGVNVQFESDEEEGDEDVYGEVREEASDDDMEGDEAVVRCTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 DYGGDKEIQNMDDNIDETYGVNVQFESDEEEGDEDVYGEVREEASDDDMEGDEAVVRCTL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 SANLVASGELMSSKKKDLHPRDIDAFWLQRQLSRFYDDAIVSQKKADEVLEILKTASDDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 SANLVASGELMSSKKKDLHPRDIDAFWLQRQLSRFYDDAIVSQKKADEVLEILKTASDDR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 ECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEKERIMGKMEADPELSKFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 ECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEKERIMGKMEADPELSKFL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 YQLHETEKEDLIREERSRRERVRQSRMDTDLETMDLDQGGEALAPRQVLDLEDLVFTQGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 YQLHETEKEDLIREERSRRERVRQSRMDTDLETMDLDQGGEALAPRQVLDLEDLVFTQGS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 HFMANKRCQLPDGSFRRQRKGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 HFMANKRCQLPDGSFRRQRKGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 LNRIQSKLYRAALETDENLLLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 LNRIQSKLYRAALETDENLLLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIY 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 IAPMRSLVQEMVGSFGKRLATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 IAPMRSLVQEMVGSFGKRLATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 GERTYTQLVRLIILDEIHLLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 GERTYTQLVRLIILDEIHLLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYED 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 VATFLRVDPAKGLFYFDNSFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEHAGKNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 VATFLRVDPAKGLFYFDNSFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEHAGKNQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 VLVFVHSRKETGKTARAIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 VLVFVHSRKETGKTARAIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPY 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 GFAIHHAGMTRVDRTLVEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 GFAIHHAGMTRVDRTLVEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 WTELGALDILQMLGRAGRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 WTELGALDILQMLGRAGRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDM 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 LNAEIVLGNVQNAKDAVNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 LNAEIVLGNVQNAKDAVNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 ALMLDKNNLVKYDKKTGNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 ALMLDKNNLVKYDKKTGNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSL 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 SSEFKNITVREEEKLELQKLLERVPIPVKESIEEPSAKINVLLQAFISQLKLEGFALMAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 SSEFKNITVREEEKLELQKLLERVPIPVKESIEEPSAKINVLLQAFISQLKLEGFALMAD 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 MVYVTQSAGRLMRAIFEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 MVYVTQSAGRLMRAIFEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVV 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 KKIEKKNFPFERLYDLNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 KKIEKKNFPFERLYDLNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKV 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 ELTITPDFQWDEKVHGSSEAFWILVEDVDSEVILHHEYFLLKAKYAQDEHLITFFVPVFE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 ELTITPDFQWDEKVHGSSEAFWILVEDVDSEVILHHEYFLLKAKYAQDEHLITFFVPVFE 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 PLPPQYFIRVVSDRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 PLPPQYFIRVVSDRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESL 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 YQDKFPFFNPIQTQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 YQDKFPFFNPIQTQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYIT 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE2 PMEALAEQVYMDWYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 PMEALAEQVYMDWYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWK 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE2 QRKNVQNINLFVVDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 QRKNVQNINLFVVDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDV 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE2 AHWLGCSATSTFNFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 AHWLGCSATSTFNFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVI 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE2 VFVPSRKQTRLTAIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 VFVPSRKQTRLTAIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYL 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE2 HEGLSPMERRLVEQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 HEGLSPMERRLVEQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYP 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE2 IYDVLQMVGHANRPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 IYDVLQMVGHANRPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEI 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE2 VTKTIENKQDAVDYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 VTKTIENKQDAVDYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSK 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE2 CISIEDEMDVAPLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 CISIEDEMDVAPLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPI 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE2 RHHEDNLLRQLAQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSAELQSDTEEILSKAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 RHHEDNLLRQLAQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSAELQSDTEEILSKAI 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE2 RLIQACVDVLSSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHIKRCTDKGVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 RLIQACVDVLSSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHIKRCTDKGVE 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE2 SVFDIMEMEDEERNALLQLTDSQIADVARFCNRYPNIELSYEVVDKDSIRSGGPVVVLVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 SVFDIMEMEDEERNALLQLTDSQIADVARFCNRYPNIELSYEVVDKDSIRSGGPVVVLVQ 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE2 LEREEEVTGPVIAPLFPQKREEGWWVVIGDAKSNSLISIKRLTLQQKAKVKLDFVAPATG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS20 LEREEEVTGPVIAPLFPQKREEGWWVVIGDAKSNSLISIKRLTLQQKAKVKLDFVAPATG 2050 2060 2070 2080 2090 2100 2110 2120 2130 pF1KE2 AHNYTLYFMSDAYMGCDQEYKFSVDVKEAETDSDSD :::::::::::::::::::::::::::::::::::: CCDS20 AHNYTLYFMSDAYMGCDQEYKFSVDVKEAETDSDSD 2110 2120 2130 >>CCDS5046.1 ASCC3 gene_id:10973|Hs108|chr6 (2202 aa) initn: 4459 init1: 1694 opt: 5032 Z-score: 5359.1 bits: 1005.3 E(32554): 0 Smith-Waterman score: 5145; 40.4% identity (70.3% similar) in 2126 aa overlap (103-2114:60-2167) 80 90 100 110 120 130 pF1KE2 KRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFIQAALG-DQPRD- : : . : . .: . .: :. :. CCDS50 KIKRSKLHEQVLDLGLTWKKIIKFLNEKLEKSKMQSINEDLKDILHAAKQIVGTDNGREA 30 40 50 60 70 80 140 150 160 170 180 190 pF1KE2 ILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKITDYGGDKEIQN : ::: .. .... :: : : ..: .. . : ..: .. .. .. CCDS50 IESGAAFLFMTFHLKDSVGHKET-KAIKQMFGPFPSSSATAACNATNRIISHFSQDDLTA 90 100 110 120 130 140 200 210 220 230 240 pF1KE2 M-----DDNIDETY-GVNVQFESDEEEGDE----DVYGEVREEASDDDMEGDEAVVRCTL . .. :... : :. : : .. :. . ::... : : . : CCDS50 LVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFDELPINGETQKTISLD--------YKKFL 150 160 170 180 190 200 250 260 270 280 290 pF1KE2 SANLVASGELMSSKKKDLHPRDIDAFW--LQRQLSRFYDDAIVSQKKAD---EVLEILKT . .: : . . : .. . . .: ... :. . . : . ..: . CCDS50 NEHL---QEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTEVPRVEDLCCTLYDMLAS 210 220 230 240 250 300 310 320 330 340 350 pF1KE2 ASDDRECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEK-----ERIMGKM .. : ...: ::: . ...:. : :.:. :. : .: . . . ..:.:. CCDS50 IKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSNDHRFQALQDNCKKILGE- 260 270 280 290 300 310 360 370 380 390 pF1KE2 EADPELSKFLYQLHETEKEDLIREERSRRERV--RQSRMDTDLET----MDLD------Q .: :. . . : ::. :... : ...:. :... :::. : .: : CCDS50 NAKPNYGCQVTIQSEQEKQ-LMKQYRREEKRIARREKKAGEDLEVSEGLMCFDPKELRIQ 320 330 340 350 360 370 400 410 420 430 pF1KE2 GGEAL-----AP---RQV-LDLEDLVF-----TQG-----SHFMANKRCQLPDGSFRRQR .:: .: :: :.: . . .:. : :.:. . ::.: :.. CCDS50 REQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIAGAKMILPEGIQRENN 380 390 400 410 420 430 440 450 460 470 480 490 pF1KE2 KGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENL : ::::..: .: :.. ::. . .. : . .: .:.:.: :::::: ....: .:.::. CCDS50 KLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRIQSIVFETAYNTNENM 440 450 460 470 480 490 500 510 520 530 540 550 pF1KE2 LLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRL :.::::::::::.:.. .:.:: .:... :.:. ..:::.:.:::..:. ::. :..:: CCDS50 LICAPTGAGKTNIAMLTVLHEIRQHFQQ-GVIKKNEFKIVYVAPMKALAAEMTDYFSRRL 500 510 520 530 540 550 560 570 580 590 600 610 pF1KE2 ATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG-GERTYTQLVRLIILDEIH :: : ::::: :: : :: ::..: ::::::..:::. :. . .:.:::.::::.: CCDS50 EPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVALSQIVRLLILDEVH 560 570 580 590 600 610 620 630 640 650 660 670 pF1KE2 LLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYEDVATFLRVDPAKGLFYFDN :::.:::::::..:::..:..: :: .:..::::::::: ::::::.:.: :::.::. CCDS50 LLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATFLHVNPYIGLFFFDG 620 630 640 650 660 670 680 690 700 710 720 730 pF1KE2 SFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEH--AGKNQVLVFVHSRKETGKTAR :::::: ::..:: . ..... :.:. ::..... :: .::.::::.:. : .:: CCDS50 RFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAG-HQVMVFVHARNATVRTAM 680 690 700 710 720 730 740 750 760 770 780 790 pF1KE2 AIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHAGMTRVDRTL .. . . . .:. . . . . .... .: ....:.: ::.:::::: : ::.: CCDS50 SLIERAKNCGHIPFFFPTQGHDYVLAEKQVQRSRNKQVRELFPDGFSIHHAGMLRQDRNL 740 750 760 770 780 790 800 810 820 830 840 850 pF1KE2 VEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGRWTELGALDILQMLGRA ::.::.. ::.::: :::::::::::::.:::::::.:. ..: ...:: ::..:..::: CCDS50 VENLFSNGHIKVLVCTATLAWGVNLPAHAVIIKGTQIYAAKRGSFVDLGILDVMQIFGRA 800 810 820 830 840 850 860 870 880 890 900 910 pF1KE2 GRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDMLNAEIVLGNVQNAKDA ::::.: ::::.::.: .:..::.::.:. :::::.. .: : :::::.::.: :...: CCDS50 GRPQFDKFGEGIIITTHDKLSHYLTLLTQRNPIESQFLESLADNLNAEIALGTVTNVEEA 860 870 880 890 900 910 920 930 940 950 960 970 pF1KE2 VNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTAALMLDKNNLVKYDKKT :.:..:.:::.:: .: ::::: . :: : ..: .:: .. ::: ........: CCDS50 VKWISYTYLYVRMRANPLAYGISHKAYQIDPTLRKHREQLVIEVGRKLDKAQMIRFEERT 920 930 940 950 960 970 980 990 1000 1010 1020 1030 pF1KE2 GNFQVTELGRIASHYYITNDTVQTYNQLLKPTLSEIELFRVFSLSSEFKNITVREEEKLE : :. :.::: :::::: .:..:.:.:. .: ..: . : . :: .: ::::: : CCDS50 GYFSSTDLGRTASHYYIKYNTIETFNELFDAHKTEGDIFAIVSKAEEFDQIKVREEEIEE 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 1090 pF1KE2 LQKLLERV-PIPVKESIEEPSAKINVLLQAFISQLKLEGFALMADMVYVTQSAGRLMRAI :. :: . . ..:. .:::.:::..::. ....:.:..: .::.:.:.:..::. CCDS50 LDTLLSNFCELSTPGGVENSYGKINILLQTYISRGEMDSFSLISDSAYVAQNAARIVRAL 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 1150 pF1KE2 FEIVLNRGWAQLTDKTLNLCKMIDKRMWQSMCPLRQFRKLPEEVVKKIEKKNFPFERLYD :::.: . : .: . ::: :.::::.: ::::: :: ... ..:.:.. ..: : CCDS50 FEIALRKRWPTMTYRLLNLSKVIDKRLWGWASPLRQFSILPPHILTRLEEKKLTVDKLKD 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 1210 pF1KE2 LNHNEIGELIRMPKMGKTIHKYVHLFPKLELSVHLQPITRSTLKVELTITPDFQWDEKVH . ..:::.... ..: ... :: .:.. . . .:::::..:.: :.: :: :...:: CCDS50 MRKDEIGHILHHVNIGLKVKQCVHQIPSVMMEASIQPITRTVLRVTLSIYADFTWNDQVH 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 1270 pF1KE2 GS-SEAFWILVEDVDSEVILHHEYFL-LKAKYAQDE-HLITFFVPVFEPLPPQYFIRVVS :. .: .:: ::: .. : : :::: :: . . : .:..: .:.::::: ::.::.:: CCDS50 GTVGEPWWIWVEDPTNDHIYHSEYFLALKKQVISKEAQLLVFTIPIFEPLPSQYYIRAVS 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 1330 pF1KE2 DRWLSCETQLPVSFRHLILPEKYPPPTELLDLQPLPVSALRNSAFESLYQDKFPFFNPIQ ::::. :. ..:.::::::..:: ::::::::::..:: .:.:.:: .: :::.: CCDS50 DRWLGAEAVCIINFQHLILPERHPPHTELLDLQPLPITALGCKAYEALY--NFSHFNPVQ 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 1390 pF1KE2 TQVFNTVYNSDDNVFVGAPTGSGKTICAEFAILRMLLQSSEGRCVYITPMEALAEQVYMD ::.:.:.:..: ::..:::::::::. ::.::.:.. . .. :::.:..::... . : CCDS50 TQIFHTLYHTDCNVLLGAPTGSGKTVAAELAIFRVFNKYPTSKAVYIAPLKALVRERMDD 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 1450 pF1KE2 WYEKFQDRLNKKVVLLTGETSTDLKLLGKGNIIISTPEKWDILSRRWKQRKNVQNINLFV : .....:.:::. :::... :.: ..:...:..:::::: .:: :..:. ::...... CCDS50 WKVRIEEKLGKKVIELTGDVTPDMKSIAKADLIVTTPEKWDGVSRSWQNRNYVQQVTILI 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 1510 pF1KE2 VDEVHLIGGENGPVLEVICSRMRYISSQIERPIRIVALSSSLSNAKDVAHWLGCSATSTF .::.::.: : ::::::: :: .:::. :.:.:::.::..:.::.:.: ::. . . : CCDS50 IDEIHLLGEERGPVLEVIVSRTNFISSHTEKPVRIVGLSTALANARDLADWLNIKQMGLF 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 1570 pF1KE2 NFHPNVRPVPLELHIQGFNISHTQTRLLSMAKPVYHAITKHSPKKPVIVFVPSRKQTRLT ::.:.:::::::.::::: .: :. :: ::...:: .::: :::..:: ::.::::: CCDS50 NFRPSVRPVPLEVHIQGFPGQHYCPRMASMNKPAFQAIRSHSPAKPVLIFVSSRRQTRLT 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 1630 pF1KE2 AIDILTTCAADIQRQRFLHCTEKDLIPYLEKLSDSTLKETLLNGVGYLHEGLSPMERRLV :..... :.. . ...:. :... . . ::.:: :: :.:. : :: .:. : CCDS50 ALELIAFLATEEDPKQWLNMDEREMENIIATVRDSNLKLTLAFGIGMHHAGLHERDRKTV 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 1690 pF1KE2 EQLFSSGAIQVVVASRSLCWGMNVAAHLVIIMDTQYYNGKIHAYVDYPIYDVLQMVGHAN :.:: . .::..:. .: ::.: :::::: :.::.:: . :::.:: :::::.:.:. CCDS50 EELFVNCKVQVLIATSTLAWGVNFPAHLVIIKGTEYYDGKTRRYVDFPITDVLQMMGRAG 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 1750 pF1KE2 RPLQDDEGRCVIMCQGSKKDFFKKFLYEPLPVESHLDHCMHDHFNAEIVTKTIENKQDAV :: ::.:. ::. . ::::.:::::::.:::: : . ::.::::. :: .::::. CCDS50 RPQFDDQGKAVILVHDIKKDFYKKFLYEPFPVESSLLGVLSDHLNAEIAGGTITSKQDAL 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 1810 pF1KE2 DYLTWTFLYRRMTQNPNYYNLQGISHRHLSDHLSELVEQTLSDLEQSKCISI-EDEMDVA ::.:::...::. .::.:::: .:: .. ::.:.:..: .:: : :: : ::. .. CCDS50 DYITWTYFFRRLIMNPSYYNLGDVSHDSVNKFLSHLIEKSLIELELSYCIEIGEDNRSIE 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 1870 pF1KE2 PLNLGMIAAYYYINYTTIELFSMSLNAKTKVRGLIEIISNAAEYENIPIRHHEDNLLRQL ::. : ::.:::... :...:. :. . ... :. :.:.: :: ..:.::.::.. .: CCDS50 PLTYGRIASYYYLKHQTVKMFKDRLKPECSTEELLSILSDAEEYTDLPVRHNEDHMNSEL 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 1930 pF1KE2 AQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSA-ELQSDTEEILSKAIRLIQACVDVL :. .: . : .:..::.:..::::::::: .: . ..::. .:..:.:. :: .:: CCDS50 AKCLPIESNPHSFDSPHTKAHLLLQAHLSRAMLPCPDYDTDTKTVLDQALRVCQAMLDVA 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE2 SSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHI----------KRCTDKGVE ...::: .: .: ::: :. : ::: : ::.. ..:. : .: CCDS50 ANQGWLVTVLNITNLIQMVIQGRWLKDSSLLTLPNIENHHLHLFKKWKPIMKGPHARGRT 1940 1950 1960 1970 1980 1990 1990 2000 2010 pF1KE2 SVFDIMEM------EDEERNALLQ--LTDSQIADVARFCNRYPNI--------------- :. .. :. .:. ..... : .. .. : .. : : CCDS50 SIESLPELIHACGGKDHVFSSMVESELHAAKTKQAWNFLSHLPVINVGISVKGSWDDLVE 2000 2010 2020 2030 2040 2050 2020 2030 2040 2050 2060 pF1KE2 ---ELSYEVVDKDS--------IRSGGPVVVLVQLER------EEEVTGPVIAPLFPQKR ::: .. :. ... :. :.:.: . . . ...: ::... CCDS50 GHNELSVSTLTADKRDDNKWIKLHADQEYVLQVSLQRVHFGFHKGKPESCAVTPRFPKSK 2060 2070 2080 2090 2100 2110 2070 2080 2090 2100 2110 pF1KE2 EEGWWVVIGDAKSNSLISIKRLTLQQKAKV-KLDFVAPAT-GAHNYTLYFMSDAYMGCDQ .:::....:.. . ::..::. .. .: .:.: .: : . :::::::: :. CCDS50 DEGWFLILGEVDKRELIALKRVGYIRNHHVASLSFYTPEIPGRYIYTLYFMSDCYLGLDQ 2120 2130 2140 2150 2160 2170 2120 2130 pF1KE2 EYKFSVDVKEAETDSDSD CCDS50 QYDIYLNVTQASLSAQVNTKVSDSLTDLALK 2180 2190 2200 >>CCDS30769.2 HFM1 gene_id:164045|Hs108|chr1 (1435 aa) initn: 706 init1: 247 opt: 1119 Z-score: 1186.4 bits: 232.7 E(32554): 9.2e-60 Smith-Waterman score: 1181; 31.5% identity (61.9% similar) in 867 aa overlap (415-1243:219-1054) 390 400 410 420 430 440 pF1KE2 SRMDTDLETMDLDQGGEALAPRQVLDLEDLVFTQGSHFMANKRCQLPDGSFRRQR--KGY ::: .. : :. .. .: :. .. CCDS30 GSVKIVQTEMNKGKSRNYSNSKQKFQYSANVFTANNAFSAS---EIGEGMFKAPSFSVAF 190 200 210 220 230 240 450 460 470 480 490 500 pF1KE2 EEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENLLLC . . . . .:: : : ..: .. :. : .: :::: . : ::.:...: CCDS30 QPHDIQEVTENGLGS---LKAVTEIPAKFRSIFKEFPYFNYIQSKAFDDLLYTDRNFVIC 250 260 270 280 290 300 510 520 530 540 550 560 pF1KE2 APTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRLATY ::::.::: : . . : . :. . ..::.:.::...: .. .. .... CCDS30 APTGSGKTVVFELAITRLL-----MEVPLPWLNIKIVYMAPIKALCSQRFDDWKEKFGPI 310 320 330 340 350 570 580 590 600 610 620 pF1KE2 GITVAELTGDHQLCKE-EISATQIIVCTPEKWDIITRKGGERTYTQLVRLIILDEIHLLH :.. ::::: . ::. ..::. :::::: .::: . . .:::::...::.:... CCDS30 GLNCKELTGDTVMDDLFEIQHAHIIMTTPEKWDSMTRKWRDNSLVQLVRLFLIDEVHIVK 360 370 380 390 400 410 630 640 650 660 670 pF1KE2 DD-RGPVLEALVAR--AIRNIEMTQED------VRLIGLSATLPNYEDVATFLRVD--PA :. :::.::..:.: ..... .: .. .:....:::.:: ::.: .: :: CCDS30 DENRGPTLEVVVSRMKTVQSVSQTLKNTSTAIPMRFVAVSATIPNAEDIAEWLSDGERPA 420 430 440 450 460 470 680 690 700 710 720 pF1KE2 KGLFYFDNSFRPVPLEQTYVGITEKKAIKRFQI---MNEIVYEKIMEHAGKNQVLVFVHS : .:.: ::: :... .:. .. .:.. .: . :. .. .. .::: . CCDS30 VCL-KMDESHRPVKLQKVVLGFPCSSNQTEFKFDLTLNYKIASVIQMYSDQKPTLVFCAT 480 490 500 510 520 530 730 740 750 760 770 780 pF1KE2 RKETGKTARAIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHA :: . ..: . : ::. .. : . . :. : . .. .:.:.: : : ::: CCDS30 RKGVQQAASV-----LVKDAKFIMTVE---QKQRLQKYAYSVRDSKLRDILKDGAAYHHA 540 550 560 570 580 790 800 810 820 830 840 pF1KE2 GMTRVDRTLVEDLFADKHIQVLVSTATLAWGVNLPAHTVIIKGTQVYSPEKGRWTELGAL :: :: .:: :. . :: .:.::: ::::::: :.::.:. :. : . : . CCDS30 GMELSDRKVVEGAFTVGDLPVLFTTSTLAMGVNLPAHLVVIKSTMHYA--GGLFEEYSET 590 600 610 620 630 640 850 860 870 880 890 900 pF1KE2 DILQMLGRAGRPQYDTKGEGILITSHGELQYYLSLLNQQLPIESQMVSKLPDMLNAEIVL :::::.:::::::.:: . ....: . . :...: . .::.. .: . ::::::: CCDS30 DILQMIGRAGRPQFDTTATAVIMTRLSTRDKYIQMLACRDTVESSLHRHLIEHLNAEIVL 650 660 670 680 690 700 910 920 930 940 950 960 pF1KE2 GNVQNAKDAVNWLGYAYLYIRMLRSPTLYGISHDDLKGDPLLDQRRLDLVHTAALMLDKN .. ... ::.:. . :::: :..:. ::.. . :. : . . . .: :.. CCDS30 HTITDVNIAVEWIRSTLLYIRALKNPSHYGFA-SGLNKDGI-EAKLQELCLKNLNDLSSL 710 720 730 740 750 760 970 980 990 1000 1010 1020 pF1KE2 NLVKYDKKTGNFQVTELGRIASHYYITNDTVQTYNQLL-KPTLSEIELFRVFSLSSEFKN .:.:.:. . ::. :: ::. . :::: .::. . . : ::: .: ... .:: . CCDS30 DLIKMDEGV-NFKPTEAGRLMAWYYITFETVKKFYTISGKETLS--DLVTLIAGCKEFLD 770 780 790 800 810 820 1030 1040 1050 1060 1070 1080 pF1KE2 ITVREEEKLELQKLLE---RVPI--PVKESIEEPSAKINVLLQAFISQLKLEGFALMADM : .: .:: :. : . :. : :.. :. :.: :.:: .. . .. ::: : CCDS30 IQLRINEKKTLNTLNKDPNRITIRFPMEGRIKTREMKVNCLIQAQLGCIPIQDFALTQDT 830 840 850 860 870 880 1090 1100 1110 1120 1130 pF1KE2 VYVTQSAGRLMRAIFEIVL--NRGWAQLTDKTLNLCKMIDKRMWQ-SMCPLRQFRKLPEE . . . ..:. : . ..: .. .: : . .: : : . ..:. :. .:..:. CCDS30 AKIFRHGSRITRWLSDFVAAQEKKFAVLLN-SLILAKCFRCKLWENSLHVSKQLEKIGIT 890 900 910 920 930 940 1140 1150 1160 1170 1180 1190 pF1KE2 VVKKIEKKNFP-FERLYDLNHNEIGELI--RMPKMGKTIHKYVHLFPKLELSVHLQPITR . . : . .. :... . . :. ::: : : .: :.. : .:: ::.: . ::: CCDS30 LSNAIVNAGLTSFKKIEETDAREL-ELILNRHPPFGTQIKETVMYLPKYELKV--EQITR 950 960 970 980 990 1200 1210 1220 1230 1240 pF1KE2 -STLKVELTITP---DFQWDEKVHGSSEAFWI--LVEDVDSEVILHHEY---FLLKAKYA : .:. .: .:. . . .:.. .. .. :.:..:. :. :::: CCDS30 YSDTTAEILVTVILRNFEQLQTKRTASDSHYVTLIIGDADNQVVYLHKITDSVLLKAGSW 1000 1010 1020 1030 1040 1050 1250 1260 1270 1280 1290 1300 pF1KE2 QDEHLITFFVPVFEPLPPQYFIRVVSDRWLSCETQLPVSFRHLILPEKYPPPTELLDLQP CCDS30 AKKIAVKRALKSEDLSINLISSEFVGLDIQQKLTVFYLEPKRFGNQITMQRKSETQISHS 1060 1070 1080 1090 1100 1110 >>CCDS75497.1 ASCC3 gene_id:10973|Hs108|chr6 (731 aa) initn: 937 init1: 677 opt: 1043 Z-score: 1110.0 bits: 217.5 E(32554): 1.7e-55 Smith-Waterman score: 1070; 33.8% identity (62.5% similar) in 678 aa overlap (103-724:60-721) 80 90 100 110 120 130 pF1KE2 KRDEDRHDINKMKGYTLLSEGIDEMVGIIYKPKTKETRETYEVLLSFIQAALG-DQPRD- : : . : . .: . .: :. :. CCDS75 KIKRSKLHEQVLDLGLTWKKIIKFLNEKLEKSKMQSINEDLKDILHAAKQIVGTDNGREA 30 40 50 60 70 80 140 150 160 170 180 190 pF1KE2 ILCGAADEVLAVLKNEKLRDKERRKEIDLLLGQTDDTRYHVLVNLGKKITDYGGDKEIQN : ::: .. .... :: : : ..: .. . : ..: .. .. .. CCDS75 IESGAAFLFMTFHLKDSVGHKET-KAIKQMFGPFPSSSATAACNATNRIISHFSQDDLTA 90 100 110 120 130 140 200 210 220 230 240 pF1KE2 M-----DDNIDETY-GVNVQFESDEEEGDE----DVYGEVREEASDDDMEGDEAVVRCTL . .. :... : :. : : .. :. . ::... : : . : CCDS75 LVQMTEKEHGDRVFFGKNLAFSFDMHDLDHFDELPINGETQKTISLD--------YKKFL 150 160 170 180 190 200 250 260 270 280 290 pF1KE2 SANLVASGELMSSKKKDLHPRDIDAFW--LQRQLSRFYDDAIVSQKKAD---EVLEILKT . .: : . . : .. . . .: ... :. . . : . ..: . CCDS75 NEHL---QEACTPELKPVEKTNGSFLWCEVEKYLNSTLKEMTEVPRVEDLCCTLYDMLAS 210 220 230 240 250 300 310 320 330 340 350 pF1KE2 ASDDRECENQLVLLLGFNTFDFIKVLRQHRMMILYCTLLASAQSEAEK-----ERIMGKM .. : ...: ::: . ...:. : :.:. :. : .: . . . ..:.:. CCDS75 IKSGDELQDELFELLGPEGLELIEKLLQNRITIVDRFLNSSNDHRFQALQDNCKKILGE- 260 270 280 290 300 310 360 370 380 390 pF1KE2 EADPELSKFLYQLHETEKEDLIREERSRRERV--RQSRMDTDLET----MDLD------Q .: :. . . : ::. :... : ...:. :... :::. : .: : CCDS75 NAKPNYGCQVTIQSEQEKQ-LMKQYRREEKRIARREKKAGEDLEVSEGLMCFDPKELRIQ 320 330 340 350 360 370 400 410 420 430 pF1KE2 GGEAL-----AP---RQV-LDLEDLVFT----------QGSHFMANKRCQLPDGSFRRQR .:: .: :: :.: . . . : :.:. . ::.: :.. CCDS75 REQALLNARSVPILSRQRDADVEKIHYPHVYDSQAEAMKTSAFIAGAKMILPEGIQRENN 380 390 400 410 420 430 440 450 460 470 480 490 pF1KE2 KGYEEVHVPALKPKPFGSEEQLLPVEKLPKYAQAGFEGFKTLNRIQSKLYRAALETDENL : ::::..: .: :.. ::. . .. : . .: .:.:.: :::::: ....: .:.::. CCDS75 KLYEEVRIPYSEPMPLSFEEKPVYIQDLDEIGQLAFKGMKRLNRIQSIVFETAYNTNENM 440 450 460 470 480 490 500 510 520 530 540 550 pF1KE2 LLCAPTGAGKTNVALMCMLREIGKHINMDGTINVDDFKIIYIAPMRSLVQEMVGSFGKRL :.::::::::::.:.. .:.:: .:... :.:. ..:::.:.:::..:. ::. :..:: CCDS75 LICAPTGAGKTNIAMLTVLHEIRQHFQQ-GVIKKNEFKIVYVAPMKALAAEMTDYFSRRL 500 510 520 530 540 550 560 570 580 590 600 610 pF1KE2 ATYGITVAELTGDHQLCKEEISATQIIVCTPEKWDIITRKG-GERTYTQLVRLIILDEIH :: : ::::: :: : :: ::..: ::::::..:::. :. . .:.:::.::::.: CCDS75 EPLGIIVKELTGDMQLSKSEILRTQMLVTTPEKWDVVTRKSVGDVALSQIVRLLILDEVH 560 570 580 590 600 610 620 630 640 650 660 670 pF1KE2 LLHDDRGPVLEALVARAIRNIEMTQEDVRLIGLSATLPNYEDVATFLRVDPAKGLFYFDN :::.:::::::..:::..:..: :: .:..::::::::: ::::::.:.: :::.::. CCDS75 LLHEDRGPVLESIVARTLRQVESTQSMIRILGLSATLPNYLDVATFLHVNPYIGLFFFDG 620 630 640 650 660 670 680 690 700 710 720 730 pF1KE2 SFRPVPLEQTYVGITEKKAIKRFQIMNEIVYEKIMEH--AGKNQVLVFVHSRKETGKTAR :::::: ::..:: . ..... :.:. ::..... :: .:: .: CCDS75 RFRPVPLGQTFLGIKCANKMQQLNNMDEVCYENVLKQVKAG-HQVHLFYLLLHLFICF 680 690 700 710 720 730 740 750 760 770 780 790 pF1KE2 AIRDMCLEKDTLGLFLREGSASTEVLRTEAEQCKNLELKDLLPYGFAIHHAGMTRVDRTL 2136 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 19:47:47 2016 done: Sun Nov 6 19:47:48 2016 Total Scan time: 5.630 Total Display time: 0.480 Function used was FASTA [36.3.4 Apr, 2011]