FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2719, 2590 aa 1>>>pF1KE2719 2590 - 2590 aa - 2590 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.2110+/-0.00135; mu= 16.3404+/- 0.081 mean_var=97.8274+/-19.575, 0's: 0 Z-trim(101.3): 49 B-trim: 0 in 0/52 Lambda= 0.129671 statistics sampled from 6429 (6454) to 6429 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.532), E-opt: 0.2 (0.198), width: 16 Scan time: 3.560 The best scores are: opt bits E(32554) CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590) 16962 3185.4 0 CCDS75158.1 HELQ gene_id:113510|Hs108|chr4 (1034) 700 143.1 7.5e-33 CCDS3603.1 HELQ gene_id:113510|Hs108|chr4 (1101) 700 143.1 8e-33 CCDS3360.1 POLN gene_id:353497|Hs108|chr4 ( 900) 477 101.3 2.4e-20 CCDS3967.1 MTREX gene_id:23517|Hs108|chr5 (1042) 310 70.1 7e-11 >>CCDS33833.1 POLQ gene_id:10721|Hs108|chr3 (2590 aa) initn: 16962 init1: 16962 opt: 16962 Z-score: 17138.1 bits: 3185.4 E(32554): 0 Smith-Waterman score: 16962; 99.9% identity (99.9% similar) in 2590 aa overlap (1-2590:1-2590) 10 20 30 40 50 60 pF1KE2 MNLLRRSGKRRRSESGSDSFSGSGGDSSASPQFLSGSVLSPPPGLGRCLKAAAAGECKPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MNLLRRSGKRRRSESGSDSFSGSGGDSSASPQFLSGSVLSPPPGLGRCLKAAAAGECKPT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VPDYEIDKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAG ::::: :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VPDYERDKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 KTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 FSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKICYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKICYI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TRKSASCQADLASSLSNAVQIVGMSATLPNLELVASWLNAELYHTDFRPVPLLESVKVGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TRKSASCQADLASSLSNAVQIVGMSATLPNLELVASWLNAELYHTDFRPVPLLESVKVGN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SIYDSSMKLVREFEPMLQVKGDEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIARE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SIYDSSMKLVREFEPMLQVKGDEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIARE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 FYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGLDSVLQKTVPWGVAFHHAGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGLDSVLQKTVPWGVAFHHAGL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 TFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGR 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 AGRKGVDTVGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 AGRKGVDTVGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 GGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 SDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPMFED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPMFED 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 WTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 WTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFF 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 TSLVLLDLISEVPLREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TSLVLLDLISEVPLREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQ 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 FQKRLTFGIQRELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FQKRLTFGIQRELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFK 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 SARKAVDEEEEAVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SARKAVDEEEEAVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 CALLHSSTCSLTHSESEVKEHTFISQTKSSYKKLTSKNKSNTIFSDSYIKHSPNIVQDLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CALLHSSTCSLTHSESEVKEHTFISQTKSSYKKLTSKNKSNTIFSDSYIKHSPNIVQDLN 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 KSREHTSSFNCNFQNGNQEHQRCSIFRARKRASLDINKEKPGASQNEGKTSDKKVVQTFS ::::::::::::::::::::: :::::::::::::::::::::::::::::::::::::: CCDS33 KSREHTSSFNCNFQNGNQEHQTCSIFRARKRASLDINKEKPGASQNEGKTSDKKVVQTFS 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 QKTKKAPLNFNSEKMSRSFRSWKRRKHLKRSRDSSPLKDSGACRIHLQGQTLSNPSLCED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QKTKKAPLNFNSEKMSRSFRSWKRRKHLKRSRDSSPLKDSGACRIHLQGQTLSNPSLCED 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 PFTLDEKKTEFRNSGPFAKNVSLSGKEKDNKTSFPLQIKQNCSWNITLTNDNFVEHIVTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PFTLDEKKTEFRNSGPFAKNVSLSGKEKDNKTSFPLQIKQNCSWNITLTNDNFVEHIVTG 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 SQSKNVTCQATSVVSEKGRGVAVEAEKINEVLIQNGSKNQNVYMKHHDIHPINQYLRKQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SQSKNVTCQATSVVSEKGRGVAVEAEKINEVLIQNGSKNQNVYMKHHDIHPINQYLRKQS 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 HEQTSTITKQKNIIERQMPCEAVSSYINRDSNVTINCERIKLNTEENKPSHFQALGDDIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HEQTSTITKQKNIIERQMPCEAVSSYINRDSNVTINCERIKLNTEENKPSHFQALGDDIS 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 RTVIPSEVLPSAGAFSKSEGQHENFLNISRLQEKTGTYTTNKTKNNHVSDLGLVLCDFED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RTVIPSEVLPSAGAFSKSEGQHENFLNISRLQEKTGTYTTNKTKNNHVSDLGLVLCDFED 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 SFYLDTQSEKIIQQMATENAKLGAKDTNLAAGIMQKSLVQQNSMNSFQKECHIPFPAEQH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SFYLDTQSEKIIQQMATENAKLGAKDTNLAAGIMQKSLVQQNSMNSFQKECHIPFPAEQH 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE2 PLGATKIDHLDLKTVGTMKQSSDSHGVDILTPESPIFHSPILLEENGLFLKKNEVSVTDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PLGATKIDHLDLKTVGTMKQSSDSHGVDILTPESPIFHSPILLEENGLFLKKNEVSVTDS 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE2 QLNSFLQGYQTQETVKPVILLIPQKRTPTGVEGECLPVPETSLNMSDSLLFDSFSDDYLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QLNSFLQGYQTQETVKPVILLIPQKRTPTGVEGECLPVPETSLNMSDSLLFDSFSDDYLV 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE2 KEQLPDMQMKEPLPSEVTSNHFSDSLCLQEDLIKKSNVNENQDTHQQLTCSNDESIIFSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KEQLPDMQMKEPLPSEVTSNHFSDSLCLQEDLIKKSNVNENQDTHQQLTCSNDESIIFSE 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE2 MDSVQMVEALDNVDIFPVQEKNHTVVSPRALELSDPVLDEHHQGDQDGGDQDERAEKSKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MDSVQMVEALDNVDIFPVQEKNHTVVSPRALELSDPVLDEHHQGDQDGGDQDERAEKSKL 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE2 TGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSSLNRKNTELNEEQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSSLNRKNTELNEEQE 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE2 VISNLETKQVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDDNGLIPPTPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VISNLETKQVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDDNGLIPPTPI 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE2 PTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRNGFKDNSPIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRNGFKDNSPIS 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE2 DTSFSLQLSQDGLQLTPASSSSESLSIIDVASDQNLFQTFIKEWRCKKRFSISLACEKIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DTSFSLQLSQDGLQLTPASSSSESLSIIDVASDQNLFQTFIKEWRCKKRFSISLACEKIR 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE2 SLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGRDAYYFSLQKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGRDAYYFSLQKE 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE2 QKHSEISASLVPPSLDPSLTLKDRMWYLQSCLRKESDKECSVVIYDFIQSYKILLLSCGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QKHSEISASLVPPSLDPSLTLKDRMWYLQSCLRKESDKECSVVIYDFIQSYKILLLSCGI 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE2 SLEQSYEDPKVACWLLDPDSQEPTLHSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SLEQSYEDPKVACWLLDPDSQEPTLHSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEH 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE2 SGRYRASVESILIFNSMNQLNSLLQKENLQDVFRKVEMPSQYCLALLELNGIGFSTAECE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SGRYRASVESILIFNSMNQLNSLLQKENLQDVFRKVEMPSQYCLALLELNGIGFSTAECE 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE2 SQKHIMQAKLDAIETQAYQLAGHSFSFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SQKHIMQAKLDAIETQAYQLAGHSFSFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGS 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE2 TRRGIDNGRKLRLGRQFSTSKDVLNKLKALHPLPGLILEWRRITNAITKVVFPLQREKCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TRRGIDNGRKLRLGRQFSTSKDVLNKLKALHPLPGLILEWRRITNAITKVVFPLQREKCL 2170 2180 2190 2200 2210 2220 2230 2240 2250 2260 2270 2280 pF1KE2 NPFLGMERIYPVSQSHTATGRITFTEPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NPFLGMERIYPVSQSHTATGRITFTEPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPM 2230 2240 2250 2260 2270 2280 2290 2300 2310 2320 2330 2340 pF1KE2 GRGKYKKGFSVNPRCQAQMEERAADRGMPFSISMRHAFVPFPGGSILAADYSQLELRILA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GRGKYKKGFSVNPRCQAQMEERAADRGMPFSISMRHAFVPFPGGSILAADYSQLELRILA 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 2390 2400 pF1KE2 HLSHDRRLIQVLNTGADVFRSIAAEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HLSHDRRLIQVLNTGADVFRSIAAEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGE 2350 2360 2370 2380 2390 2400 2410 2420 2430 2440 2450 2460 pF1KE2 QMGIKENDAACYIDSFKSRYTGINQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QMGIKENDAACYIDSFKSRYTGINQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYR 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500 2510 2520 pF1KE2 KAHAERQAINTIVQGSAADIVKIATVNIQKQLETFHSTFKSHGHREGMLQSDRTGLSRKR ::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::: CCDS33 KAHAERQAINTIVQGSAADIVKIATVNIQKQLETFHSTFKSHGHREGMLQSDQTGLSRKR 2470 2480 2490 2500 2510 2520 2530 2540 2550 2560 2570 2580 pF1KE2 KLQGMFCPIRGGFFILQLHDELLYEVAEEDVVQVAQIVKNEMESAVKLSVKLKVKVKIGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KLQGMFCPIRGGFFILQLHDELLYEVAEEDVVQVAQIVKNEMESAVKLSVKLKVKVKIGA 2530 2540 2550 2560 2570 2580 2590 pF1KE2 SWGELKDFDV :::::::::: CCDS33 SWGELKDFDV 2590 >>CCDS75158.1 HELQ gene_id:113510|Hs108|chr4 (1034 aa) initn: 1097 init1: 369 opt: 700 Z-score: 703.2 bits: 143.1 E(32554): 7.5e-33 Smith-Waterman score: 1166; 31.0% identity (60.0% similar) in 872 aa overlap (4-856:253-1005) 10 20 30 pF1KE2 MNLLRRSGKRRRSESGSDSFSG--SGGDSSASP .: :. : .: .: ... .:. .. .: CCDS75 WKSSSHNTVNEELPHNCIEQPQQNDESSSKVRTSSDMNRRKSIKDHLKNAMTGNAKAQTP 230 240 250 260 270 280 40 50 60 70 80 90 pF1KE2 QFLSGSVLSPPPGLGRCLKAAAAGECKPTVPDYEIDKLLLANWGLPKAVLEKYHSF-GVK : : : : . . : :: . : : ..::. : . : .: :.. CCDS75 IF------SRSKQLKDTLLSEEINVAKKTVESSSND--LGPFYSLPSKVRDLYAQFKGIE 290 300 310 320 330 100 110 120 130 140 150 pF1KE2 KMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVLEMRKKALFILPFVSVA :..::: :: :..: : :::.:: :::.:::::::.:.:...: :: .:.:::.:... CCDS75 KLYEWQHTCLTLNSVQERKNLIYSLPTSGGKTLVAEILMLQELLCCRKDVLMILPYVAIV 340 350 360 370 380 390 160 170 180 190 200 210 pF1KE2 KEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERANGLINRLIEENKMDLL .:: CCDS75 QEK--------------------------------------------------------- 220 230 240 250 260 270 pF1KE2 GMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLASSLSNAVQIVGMSATLPN :::.:.. :: ::. :.:: : .. . ::.:::::: : CCDS75 -------LHMIGEGSRGATLEMTLAKILYTSKTT---------------QIIGMSATLNN 400 410 420 430 280 290 300 310 320 pF1KE2 LELVASWLNAELYHTDFRPVPLLESVKVGNSIY--DSSMKLVREFEPMLQVKG------- .: . ..:.:: : ..:::: : : .:....:: ::. . : .:. : CCDS75 VEDLQKFLQAEYYTSQFRPVELKEYLKINDTIYEVDSKAENGMTFSRLLNYKYSDTLKKM 440 450 460 470 480 490 330 340 350 360 370 380 pF1KE2 DEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVI : ::.:.: :.: :.: :.:::::: ::..:..: . : . .. .: .: CCDS75 DPDHLVALVTEVI-PNYSCLVFCPSKKNCENVAEMICK-FLSKEY-----LKHKE----- 500 510 520 530 540 390 400 410 420 430 440 pF1KE2 LEQKELLEVMDQLRRLPSG-LDSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVL :: ::. .:. . .: : ::..:.:.:::.::.::: .:: ..: :. :.. .. CCDS75 ---KEKCEVIKNLKNIGNGNLCPVLKRTIPFGVAYHHSGLTSDERKLLEEAYSTGVLCLF 550 560 570 580 590 600 450 460 470 480 490 500 pF1KE2 AATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGRAGRKGVDTVGESILICKNSE . ::::..::::::::::.:.: . . : ::::.::::: :.::.:::::: .... CCDS75 TCTSTLAAGVNLPARRVILRAPYVAKEFLKRNQYKQMIGRAGRAGIDTIGESILILQEKD 610 620 630 640 650 660 510 520 530 540 550 pF1KE2 KSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIVG-GVASTSQDMHTYAACTFL :.. . :. ::...: .. : . : :.... ..: .:.. .:.. . ::. CCDS75 KQQVLELI---TKPLENCYSHLVQEFTKG--IQTLFLSLIGLKIATNLDDIYHFMNGTFF 670 680 690 700 710 560 570 580 590 600 610 pF1KE2 AASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEASDGTEGKVY--HPTHLGSA .. .: . ...:. ..:. . .: :. ..:. . : : : :.:: : CCDS75 GV-----QQKVLLKEKSLWEITVES-LRYLTEKGLLQKDTIYKSEEEVQYNFHITKLGRA 720 730 740 750 760 620 630 640 650 660 670 pF1KE2 TLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPM-FEDWTTIDWYRFFCLWEKL ....... : .. ::.....:.:::. ::..::.::. . . . ::. .: . .: CCDS75 SFKGTIDLAYCDILYRDLKKGLEGLVLESLLHLIYLTTPYDLVSQCNPDWMIYFRQFSQL 770 780 790 800 810 820 680 690 700 710 720 730 pF1KE2 PTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFFTSLVLLDLISEVPLRE . . :: ..:: :.:... ..:..... .. . .:.. :.:: :..:. . CCDS75 SPAEQNVAAILGVSESFIGKKASGQAIGKKVDKN----VVNRLYLSFVLYTLLKETNIWT 830 840 850 860 870 880 740 750 760 770 780 790 pF1KE2 INQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLG--WHNMELLLSQFQKRLTFGIQRELC ...:.. :: ::.: ..: ... . : ..: : .. :: .. :.::. .. :: CCDS75 VSEKFNMPRGYIQNLLTGTASFSSCVLHFCEELEEFW-VYRALLVELTKKLTYCVKAELI 890 900 910 920 930 940 800 810 820 830 840 850 pF1KE2 DLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFKSARKAVDEEEEAVE :..:. . ::. ::..:.... :: :: :: : . . ..:.. :. . .. CCDS75 PLMEVTGVLEGRAKQLYSAGYKSLMHLANANP-EVLVRTIDHLSRRQAKQIVSSAKMLLH 950 960 970 980 990 1000 860 870 880 890 900 910 pF1KE2 ERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNPCALLHSSTCSLTHS :. CCDS75 EKAEALQEEVEELLRLPSDFPGAVASSTDKA 1010 1020 1030 >>CCDS3603.1 HELQ gene_id:113510|Hs108|chr4 (1101 aa) initn: 1220 init1: 369 opt: 700 Z-score: 702.8 bits: 143.1 E(32554): 8e-33 Smith-Waterman score: 1434; 33.7% identity (65.1% similar) in 875 aa overlap (4-856:253-1072) 10 20 30 pF1KE2 MNLLRRSGKRRRSESGSDSFSG--SGGDSSASP .: :. : .: .: ... .:. .. .: CCDS36 WKSSSHNTVNEELPHNCIEQPQQNDESSSKVRTSSDMNRRKSIKDHLKNAMTGNAKAQTP 230 240 250 260 270 280 40 50 60 70 80 90 pF1KE2 QFLSGSVLSPPPGLGRCLKAAAAGECKPTVPDYEIDKLLLANWGLPKAVLEKYHSF-GVK : : : : . . : :: . : : ..::. : . : .: :.. CCDS36 IF------SRSKQLKDTLLSEEINVAKKTVESSSND--LGPFYSLPSKVRDLYAQFKGIE 290 300 310 320 330 100 110 120 130 140 150 pF1KE2 KMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVLEMRKKALFILPFVSVA :..::: :: :..: : :::.:: :::.:::::::.:.:...: :: .:.:::.:... CCDS36 KLYEWQHTCLTLNSVQERKNLIYSLPTSGGKTLVAEILMLQELLCCRKDVLMILPYVAIV 340 350 360 370 380 390 160 170 180 190 200 pF1KE2 KEKKYYLQSLFQEVGIKVDGYMGSTS---PSRHFSSLDIAVCTIERANGLINRLIEENKM .:: :.:. :.:. :. : :: . :... . .. . :::....:.: ::: ... CCDS36 QEKISGLSSFGIELGFFVEEYAGSKGRFPPTKRREKKSLYIATIEKGHSLVNSLIETGRI 400 410 420 430 440 450 210 220 230 240 250 260 pF1KE2 DLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLASSLSNAVQIVGMSAT : ::.::::::::.:.. :: ::. :.:: : .. . ::.::::: CCDS36 DSLGLVVVDELHMIGEGSRGATLEMTLAKILYTSKTT---------------QIIGMSAT 460 470 480 490 270 280 290 300 310 320 pF1KE2 LPNLELVASWLNAELYHTDFRPVPLLESVKVGNSIY--DSSMKLVREFEPMLQVKG---- : :.: . ..:.:: : ..:::: : : .:....:: ::. . : .:. : CCDS36 LNNVEDLQKFLQAEYYTSQFRPVELKEYLKINDTIYEVDSKAENGMTFSRLLNYKYSDTL 500 510 520 530 540 550 330 340 350 360 370 pF1KE2 ---DEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECP : ::.:.: :.: :.: :.:::::: ::..:..: . : . .. .: .: CCDS36 KKMDPDHLVALVTEVI-PNYSCLVFCPSKKNCENVAEMICK-FLSKEY-----LKHKE-- 560 570 580 590 600 610 380 390 400 410 420 430 pF1KE2 PVILEQKELLEVMDQLRRLPSG-LDSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLI :: ::. .:. . .: : ::..:.:.:::.::.::: .:: ..: :. :.. CCDS36 ------KEKCEVIKNLKNIGNGNLCPVLKRTIPFGVAYHHSGLTSDERKLLEEAYSTGVL 620 630 640 650 660 440 450 460 470 480 490 pF1KE2 RVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGRAGRKGVDTVGESILICK ... ::::..::::::::::.:.: . . : ::::.::::: :.::.:::::: . CCDS36 CLFTCTSTLAAGVNLPARRVILRAPYVAKEFLKRNQYKQMIGRAGRAGIDTIGESILILQ 670 680 690 700 710 720 500 510 520 530 540 550 pF1KE2 NSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIVG-GVASTSQDMHTYAAC ...:.. . :. ::...: .. : . : :.... ..: .:.. .:.. . CCDS36 EKDKQQVLELI---TKPLENCYSHLVQEFTKG--IQTLFLSLIGLKIATNLDDIYHFMNG 730 740 750 760 770 560 570 580 590 600 610 pF1KE2 TFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEASDGTEGKVY--HPTHL ::... .: . ...:. ..:. . .: :. ..:. . : : : :.: CCDS36 TFFGV-----QQKVLLKEKSLWEITVES-LRYLTEKGLLQKDTIYKSEEEVQYNFHITKL 780 790 800 810 820 830 620 630 640 650 660 670 pF1KE2 GSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPM-FEDWTTIDWYRFFCLW : :....... : .. ::.....:.:::. ::..::.::. . . . ::. .: . CCDS36 GRASFKGTIDLAYCDILYRDLKKGLEGLVLESLLHLIYLTTPYDLVSQCNPDWMIYFRQF 840 850 860 870 880 890 680 690 700 710 720 730 pF1KE2 EKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFFTSLVLLDLISEVP .: . . :: ..:: :.:... ..:..... .. . .:.. :.:: :..:. CCDS36 SQLSPAEQNVAAILGVSESFIGKKASGQAIGKKVDKN----VVNRLYLSFVLYTLLKETN 900 910 920 930 940 740 750 760 770 780 790 pF1KE2 LREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLG--WHNMELLLSQFQKRLTFGIQR . ...:.. :: ::.: ..: ... . : ..: : .. :: .. :.::. .. CCDS36 IWTVSEKFNMPRGYIQNLLTGTASFSSCVLHFCEELEEFW-VYRALLVELTKKLTYCVKA 950 960 970 980 990 1000 800 810 820 830 840 850 pF1KE2 ELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFKSARKAVDEEEE :: :..:. . ::. ::..:.... :: :: :: : . . ..:.. :. . CCDS36 ELIPLMEVTGVLEGRAKQLYSAGYKSLMHLANANP-EVLVRTIDHLSRRQAKQIVSSAKM 1010 1020 1030 1040 1050 1060 860 870 880 890 900 910 pF1KE2 AVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNPCALLHSSTCSL ..:. CCDS36 LLHEKAEALQEEVEELLRLPSDFPGAVASSTDKA 1070 1080 1090 1100 >>CCDS3360.1 POLN gene_id:353497|Hs108|chr4 (900 aa) initn: 947 init1: 357 opt: 477 Z-score: 478.8 bits: 101.3 E(32554): 2.4e-20 Smith-Waterman score: 786; 25.6% identity (54.1% similar) in 979 aa overlap (1646-2585:10-855) 1620 1630 1640 1650 1660 1670 pF1KE2 EKSKLTGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSS--LNRKN- .: ..:: . : :. :. .. :. CCDS33 MENYEALVGFDLCNTPLSSVAQKIMSAMHSGDLVDSKTW 10 20 30 1680 1690 1700 1710 1720 1730 pF1KE2 TELNEEQEVISNLETK-QVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDD . .: .:::.. .: .:: . .... :. .. :...... ...: :.. : . : CCDS33 GKSTETMEVINKSSVKYSVQLEDRKTQSPEKKDLKSLRSQTSRG-SAKLSPQSFSVRLTD 40 50 60 70 80 90 1740 1750 1760 1770 1780 1790 pF1KE2 NGLIPPTPIPTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRN . . : :.::. . : : . .::: :.: .:. CCDS33 Q--LSADQKQKSISSLTLSSCLIPQYN--QEASVLQK------------KGH-----KRK 100 110 120 130 1800 1810 1820 1830 1840 1850 pF1KE2 GFKDNSPISDTSFSLQLSQDGLQLTPAS-SSSESLSIIDVASDQNLFQTFIKEWRCKKRF : .. .... :..:.. . . : ..:..... . ..: . . . . ::.: CCDS33 HFLMENINNENKGSINLKRKHITYNNLSEKTSKQMALEEDTDDAEGYLNSGNSGALKKHF 140 150 160 170 180 190 1860 1870 1880 1890 1900 1910 pF1KE2 SISLACEKIRSLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGR :. :: : . . . .:::.. . :: : :.: : .. : CCDS33 -----CD-IRHLDDWAKSQLIEMLKQAAALVITVMYTDGSTQLGADQTPVSSV------R 200 210 220 230 240 1920 1930 1940 1950 pF1KE2 DAYYF-SLQKEQKHSEISASLVPPSL------DPSLTLK---DRMW---------YLQSC . . : : :. .: : : :: . .. . .: . .. CCDS33 GIVVLVKRQAEGGHGCPDAPACGPVLEGFVSDDPCIYIQIEHSAIWDQEQEAHQQFARNV 250 260 270 280 290 300 1960 1970 1980 1990 2000 pF1KE2 LRKESDKECSVVIYDFIQSYKILLLSCGISLEQSYE------DPKVACWLLDPDSQEPTL : . .: :. .. . .:.: : . .. ::..: ::.::.. :.. CCDS33 LFQTMKCKCPVICFNAKDFVRIVLQFFGNDGSWKHVADFIGLDPRIAAWLIDPSDATPSF 310 320 330 340 350 360 2010 2020 2030 2040 2050 2060 pF1KE2 HSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEHSGRYRASVESILIFNSMNQLNSLLQ ...: .. : . .... : .: .. . : .... .. .: : :. CCDS33 EDLVEKYC--EKSITVKVNSTYGNSSRNIV-----NQNVRENLKT--LYRLTMDLCSKLK 370 380 390 400 410 2070 2080 2090 2100 2110 2120 pF1KE2 KENLQDVFRKVEMPSQYCLALLELNGIGFSTAECESQKHIMQAKLDAIETQAYQLAGHSF .: ..:: .:.: ::..: ..: . : :. . .. :.: .: .:. .::. : CCDS33 DYGLWQLFRTLELPLIPILAVMESHAIQVNKEEMEKTSALLGARLKELEQEAHFVAGERF 420 430 440 450 460 470 2130 2140 2150 2160 2170 2180 pF1KE2 SFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGSTRRGIDNGRKLRLGRQFSTSKDVLN .::.... :.:: .::: .. .: ...: : : : . :::. ::: CCDS33 LITSNNQLREILFGKLKL----HLLSQ--RNSL--PRTG--------LQKYPSTSEAVLN 480 490 500 510 520 2190 2200 2210 2220 2230 2240 pF1KE2 KLKALHPLPGLILEWRRITNAITKVVFPLQREKCLNPFLGMERIYPVSQSHTATGRITFT :. ::::: .:::.:.. . . : : :.. .. . .:. :.:::.. CCDS33 ALRDLHPLPKIILEYRQVHKIKSTFVDGLL--ACMKKG-SISSTW--NQTGTVTGRLSAK 530 540 550 560 570 2250 2260 2270 2280 2290 2300 pF1KE2 EPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPMGRGKYKKGFSVNPRCQAQMEERAAD .::::.. : : . .: :.. .:: : ....:: . CCDS33 HPNIQGIS-----KHPIQI-TTP------KNF----KGKEDKILTISPRAM--------- 580 590 600 610 2310 2320 2330 2340 2350 2360 pF1KE2 RGMPFSISMRHAFVPFPGGSILAADYSQLELRILAHLSHDRRLIQVLNTGA--DVFRSIA :: : ..::::.::.:::::.::: : .:..... . ::: ... CCDS33 ------------FVSSKGHTFLAADFSQIELRILTHLSGDPELLKLFQESERDDVFSTLT 620 630 640 650 2370 2380 2390 2400 2410 2420 pF1KE2 AEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGEQMGIKENDAACYIDSFKSRYTGI ..:: . :.: :.:.:.. :...:: : . :. .:. ..:: ...:: ..: : CCDS33 SQWKDVPVEQVTHADREQTKKVVYAVVYGAGKERLAACLGVPIQEAAQFLESFLQKYKKI 660 670 680 690 700 710 2430 2440 2450 2460 2470 2480 pF1KE2 NQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYRKAHAERQAINTIVQGSAADIVKI ..: .. .:.. : : .:.:::: :: :. .. .:.:::::.: .:::::::. :. CCDS33 KDFARAAIAQCHQTGCVVSIMGRRRPLPRIHAHDQQLRAQAERQAVNFVVQGSAADLCKL 720 730 740 750 760 770 2490 2500 2510 2520 2530 2540 pF1KE2 ATVNIQKQLETFHSTFKSHGHREGMLQSDRTGLSRKRKLQGMFCPIRGGFFILQLHDELL : ... : .. :: : .: .. :.::::: CCDS33 AMIHV------FTAVAASH-----------TLTAR---------------LVAQIHDELL 780 790 800 2550 2560 2570 2580 2590 pF1KE2 YEVAEEDVVQVAQIVKNEMES-------AVKLSVKLKVKVKIGASWGELKDFDV .:: . .. . : .:. ::: ..:.: :::... : :::.: CCDS33 FEVEDPQIPECAALVRRTMESLEQVQALELQLQVPLKVSLSAGRSWGHLVPLQEAWGPPP 810 820 830 840 850 860 CCDS33 GPCRTESPSNSLAAPGSPASTQPPPLHFSPSFCL 870 880 890 900 >>CCDS3967.1 MTREX gene_id:23517|Hs108|chr5 (1042 aa) initn: 311 init1: 126 opt: 310 Z-score: 308.9 bits: 70.1 E(32554): 7e-11 Smith-Waterman score: 387; 27.3% identity (54.6% similar) in 454 aa overlap (105-520:151-564) 80 90 100 110 120 130 pF1KE2 GLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVL : ...... :: ::::::. :: : .: CCDS39 DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHTSAGKTVCAEYAI-ALAL 130 140 150 160 170 140 150 160 170 180 190 pF1KE2 EMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERA . .....: :. .....: . ::.::. . : . . .:. : : . . CCDS39 REKQRVIFTSPIKALSNQKYREMYEEFQDVGL-MTGDV-TINPT--------ASCLVMTT 180 190 200 210 220 200 210 220 230 240 250 pF1KE2 NGLINRLIEENK-MDLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLAS . : . : . .. : .. :. ::.:.. ::.:: . : . CCDS39 EILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIIL----------------- 230 240 250 260 270 260 270 280 290 300 pF1KE2 SLSNAVQIVGMSATLPNLELVASWLN------AELYHTDFRPVPLLESV-KVGNS----I : . :. : .:::.:: . : :. .. .::.::.:: . . .:.. . CCDS39 -LPDNVHYVFLSATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGDGLHLV 280 290 300 310 320 330 310 320 330 340 pF1KE2 YDSSMKLVRE--FEPMLQV--------KGDE----------DHVVSLCYETICDN-HSVL : . . :: :. .:: :::. ..: .. . : . :. CCDS39 VDENGDF-REDNFNTAMQVLRDAGDLAKGDQKGRKGGTKGPSNVFKIVKMIMERNFQPVI 340 350 360 370 380 390 350 360 370 380 390 400 pF1KE2 LFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGL .: ::: :: : ... .: .. . .:. :. . . : :. ..::. . CCDS39 IFSFSKKDCEAYALQMTKLDFNTDEEKK-MVEE-----VFSNAIDCLS--DEDKKLPQ-V 400 410 420 430 440 410 420 430 440 450 460 pF1KE2 DSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRT . :: . :...::.:: .. :: : .:::..: :: :.. :.:.::: :.. . CCDS39 EHVLP-LLKRGIGIHHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTN 450 460 470 480 490 500 470 480 490 500 510 pF1KE2 P-IFGGRPLDILT---YKQMVGRAGRKGVDTVGESILICKNSEK-SKGIALLQGSLKPVR : :. . .. : :: :::::.:.: : ::. .. . . : ::.:: :. CCDS39 ARKFDGKDFRWISSGEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIGKQLLKGSADPLN 510 520 530 540 550 560 520 530 540 550 560 570 pF1KE2 SCLQRREGEEVTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQES : .. CCDS39 SAFHLTYNMVLNLLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNE 570 580 590 600 610 620 2590 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Feb 25 13:19:50 2018 done: Sun Feb 25 13:19:50 2018 Total Scan time: 3.560 Total Display time: 0.340 Function used was FASTA [36.3.4 Apr, 2011]