FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4248, 944 aa 1>>>pF1KE4248 944 - 944 aa - 944 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.5192+/-0.00107; mu= -1.3765+/- 0.065 mean_var=272.8999+/-55.073, 0's: 0 Z-trim(113.1): 14 B-trim: 0 in 0/52 Lambda= 0.077638 statistics sampled from 13742 (13754) to 13742 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.733), E-opt: 0.2 (0.422), width: 16 Scan time: 4.630 The best scores are: opt bits E(32554) CCDS56182.1 RIN2 gene_id:54453|Hs108|chr20 ( 944) 6321 721.9 1.4e-207 CCDS32144.1 RIN3 gene_id:79890|Hs108|chr14 ( 985) 1065 133.2 2.4e-30 CCDS31614.1 RIN1 gene_id:9610|Hs108|chr11 ( 783) 715 94.0 1.2e-18 >>CCDS56182.1 RIN2 gene_id:54453|Hs108|chr20 (944 aa) initn: 6321 init1: 6321 opt: 6321 Z-score: 3840.3 bits: 721.9 E(32554): 1.4e-207 Smith-Waterman score: 6321; 100.0% identity (100.0% similar) in 944 aa overlap (1-944:1-944) 10 20 30 40 50 60 pF1KE4 MLDSFSQESTLPFREARKRTSFQPVQVWRNFTASQTTESPACSGASLGEMTAWTMGARGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MLDSFSQESTLPFREARKRTSFQPVQVWRNFTASQTTESPACSGASLGEMTAWTMGARGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 DKRGSFFKLIDTIASEIGELKQEMVRTDVNLENGLEPAETHSMVRHKDGGYSEEEDVKTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 DKRGSFFKLIDTIASEIGELKQEMVRTDVNLENGLEPAETHSMVRHKDGGYSEEEDVKTC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 ARDSGYDSLSNRLSILDRLLHTHPIWLQLSLSEEEAAEVLQAQPPGIFLVHKSTKMQKKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ARDSGYDSLSNRLSILDRLLHTHPIWLQLSLSEEEAAEVLQAQPPGIFLVHKSTKMQKKV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 LSLRLPCEFGAPLKEFAIKESTYTFSLEGSGISFADLFRLIAFYCISRDVLPFTLKLPYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LSLRLPCEFGAPLKEFAIKESTYTFSLEGSGISFADLFRLIAFYCISRDVLPFTLKLPYA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ISTAKSEAQLEELAQMGLNFWSSPADSKPPNLPPPHRPLSSDGVCPASLRQLCLINGVHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ISTAKSEAQLEELAQMGLNFWSSPADSKPPNLPPPHRPLSSDGVCPASLRQLCLINGVHS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 IKTRTPSELECSQTNGALCFINPLFLKVHSQDLSGGLKRPSTRTPNANGTERTRSPPPRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IKTRTPSELECSQTNGALCFINPLFLKVHSQDLSGGLKRPSTRTPNANGTERTRSPPPRP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 PPPAINSLHTSPRLARTETQTSMPETVNHNKHGNVALPGTKPTPIPPPRLKKQASFLEAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PPPAINSLHTSPRLARTETQTSMPETVNHNKHGNVALPGTKPTPIPPPRLKKQASFLEAE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GGAKTLSGGRPGAGPELELGTAGSPGGAPPEAAPGDCTRAPPPSSESRPPCHGGRQRLSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GGAKTLSGGRPGAGPELELGTAGSPGGAPPEAAPGDCTRAPPPSSESRPPCHGGRQRLSD 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 MSISTSSSDSLEFDRSMPLFGYEADTNSSLEDYEGESDQETMAPPIKSKKKRSSSFVLPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MSISTSSSDSLEFDRSMPLFGYEADTNSSLEDYEGESDQETMAPPIKSKKKRSSSFVLPK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 LVKSQLQKVSGVFSSFMTPEKRMVRRIAELSRDKCTYFGCLVQDYVSFLQENKECHVSST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LVKSQLQKVSGVFSSFMTPEKRMVRRIAELSRDKCTYFGCLVQDYVSFLQENKECHVSST 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 DMLQTIRQFMTQVKNYLSQSSELDPPIESLIPEDQIDVVLEKAMHKCILKPLKGHVEAML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 DMLQTIRQFMTQVKNYLSQSSELDPPIESLIPEDQIDVVLEKAMHKCILKPLKGHVEAML 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 KDFHMADGSWKQLKENLQLVRQRNPQELGVFAPTPDFVDVEKIKVKFMTMQKMYSPEKKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KDFHMADGSWKQLKENLQLVRQRNPQELGVFAPTPDFVDVEKIKVKFMTMQKMYSPEKKV 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 MLLLRVCKLIYTVMENNSGRMYGADDFLPVLTYVIAQCDMLELDTEIEYMMELLDPSLLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MLLLRVCKLIYTVMENNSGRMYGADDFLPVLTYVIAQCDMLELDTEIEYMMELLDPSLLH 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 GEGGYYLTSAYGALSLIKNFQEEQAARLLSSETRDTLRQWHKRRTTNRTIPSVDDFQNYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GEGGYYLTSAYGALSLIKNFQEEQAARLLSSETRDTLRQWHKRRTTNRTIPSVDDFQNYL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 RVAFQEVNSGCTGKTLLVRPYITTEDVCQICAEKFKVGDPEEYSLFLFVDETWQQLAEDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 RVAFQEVNSGCTGKTLLVRPYITTEDVCQICAEKFKVGDPEEYSLFLFVDETWQQLAEDT 850 860 870 880 890 900 910 920 930 940 pF1KE4 YPQKIKAELHSRPQPHIFHFVYKRIKNDPYGIIFQNGEEDLTTS :::::::::::::::::::::::::::::::::::::::::::: CCDS56 YPQKIKAELHSRPQPHIFHFVYKRIKNDPYGIIFQNGEEDLTTS 910 920 930 940 >>CCDS32144.1 RIN3 gene_id:79890|Hs108|chr14 (985 aa) initn: 1320 init1: 339 opt: 1065 Z-score: 658.3 bits: 133.2 E(32554): 2.4e-30 Smith-Waterman score: 1466; 34.2% identity (57.6% similar) in 959 aa overlap (109-923:23-961) 80 90 100 110 120 130 pF1KE4 ELKQEMVRTDVNLENGLEPAETHSMVRHKDGGYSEEED-VKTCARDSGYDSLSNR--LSI : :::: .. : . . : .: .:: CCDS32 MIRHAGAPARGDPTGPVPVVGKGEEEEEEDGMRLCLPANPKNCLPHRRGISI 10 20 30 40 50 140 150 160 170 180 190 pF1KE4 LDRLLHTHPIWLQLSLSEEEAAEVLQAQPPGIFLVHKSTKMQKKVLSLRLPC--EFGAPL :..:..: :.::::::.. :.:..:. :.:::..... .. :: ...: : .: . CCDS32 LEKLIKTCPVWLQLSLGQAEVARILHRVVAGMFLVRRDSSSKQLVLCVHFPSLNESSAEV 60 70 80 90 100 110 200 210 220 230 240 250 pF1KE4 KEFAIKESTYTFSLEGSGISFADLFRLIAFYCISRDVLPFTLKLPYAISTAKSEAQLEEL :..::: . ::::.. : :.::::::::.:::.:::::.:: :: :.: ..:: . CCDS32 LEYTIKEEKSILYLEGSALVFEDIFRLIAFYCVSRDLLPFTLRLPQAILEASSFTDLETI 120 130 140 150 160 170 260 270 280 290 300 pF1KE4 AQMGLNFWSS----PADSKPPNLPP----PHRPLSSDGVCPASLRQLCLINGVHSIKTRT :..::.::.: : . : :: : :: : ::: .:. . CCDS32 ANLGLGFWDSSLNPPQERGKPAEPPRDRAPGFPLVS------SLRPT-----AHDAN--C 180 190 200 210 310 320 330 340 350 pF1KE4 PSELECSQTNGALCFINPLFLKVHSQDLS------GGLK-RPSTRTPNANG-TER--TRS :.: : : : :.::.:.. :. : :. :: : .:.. : : : CCDS32 ACEIELSVGNDRLWFVNPIFIEDCSSALPTDQPPLGNCPARPLPPTSDATSPTSRWAPRR 220 230 240 250 260 270 360 370 380 390 pF1KE4 PPPRPP-----------PPAINSLH--------TSPRLARTETQTSMPETVNHN------ ::: :: ::.. .: ::: . .. : .: CCDS32 PPPPPPVLPLQPCSPAQPPVLPALAPAPACPLPTSPPVPAPHVTPHAPGPPDHPNQPPMM 280 290 300 310 320 330 400 410 pF1KE4 --------------------KHGNVA----------LPGTKPTPIPPPR--------LKK : : .. ::. : : ::: :. CCDS32 TCERLPCPTAGLGPLREEAMKPGAASSPLQQVPAPPLPAKKNLPTAPPRRRVSERVSLED 340 350 360 370 380 390 420 430 440 pF1KE4 QASFLEAEGGAKTLSGGRPGAGPE------LELG------------------TAGSPGGA :. . ::: .: . ::: : : :: .: CCDS32 QSPGMAAEGDQLSLPPQGTSDGPEDTPRESTEQGQDTEVKASDPHSMPELPRTAKQPPVP 400 410 420 430 440 450 450 460 470 480 pF1KE4 PPEA------------APGD----CTRA-----P---PPSSESRPPCHGGRQRLSDMSIS ::. :: . ::.: : :: . : ..: :. . . CCDS32 PPRKKRISRQLASTLPAPLENAELCTQAMALETPTPGPPREGQSPASQAGTQH-PPAQAT 460 470 480 490 500 510 490 500 510 520 530 540 pF1KE4 TSSSDSLEFDRSMPLFGYEADTN---SSLEDYEGESDQETMAPPIKSKKKRSSSFVLPKL . :..: :: :. .. .. .. ..: : .: . . . :.. :..: : CCDS32 AHSQSSPEFKGSLASLSDSLGVSVMATDQDSYSTSSTEEELEQFSSPSVKKKPSMILGKA 520 530 540 550 560 570 550 560 570 580 590 600 pF1KE4 V-KSQLQKVSGVFSSFMTPEKRMVRRIAELSRDKCTYFGCLVQDYVSFLQENKECHVSST . .. . :..: .:.. .... ....::..:: .::: ::::: . : ..::: CCDS32 RHRLSFASFSSMFHAFLSNNRKLYKKVVELAQDKGSYFGSLVQDYKVYSLEMMARQTSST 580 590 600 610 620 630 610 620 630 640 650 pF1KE4 DMLQTIRQFMTQVKNYLSQSSEL----DPPIESLIPEDQIDVVLEKAMHKCILKPLKGHV .::: :: .:::.:.:: ::.:: :: ..: :.......:.:..::.::::: . CCDS32 EMLQEIRTMMTQLKSYLLQSTELKALVDPALHS---EEELEAIVESALYKCVLKPLKEAI 640 650 660 670 680 690 660 670 680 690 700 710 pF1KE4 EAMLKDFHMADGSWKQLKENLQLVRQRNPQELGVFAPTPDFVDVEKIKVKFMTMQKMYSP .. :...: ::: .::::: .. . .::: . .:. .::: :: .:.: ::: CCDS32 NSCLHQIHSKDGSLQQLKENQLVILATTTTDLGVTTSVPEVPMMEKILQKFTSMHKAYSP 700 710 720 730 740 750 720 730 740 750 760 770 pF1KE4 EKKVMLLLRVCKLIYTVME-NNSGRMYGADDFLPVLTYVIAQCDMLELDTEIEYMMELLD :::. .::..::::: : .: :. :::::::::: ::.:. .. :. ..::::::.: CCDS32 EKKISILLKTCKLIYDSMALGNPGKPYGADDFLPVLMYVLARSNLTEMLLNVEYMMELMD 760 770 780 790 800 810 780 790 800 810 820 830 pF1KE4 PSLLHGEGGYYLTSAYGALSLIKNFQEEQAARLLSSETRDTLRQWHKRRTTNRTIPSVDD :.: :::.::::..:::: ::.... ..: :: :..:....:..::: :.. : .. CCDS32 PALQLGEGSYYLTTTYGALEHIKSYDKITVTRQLSVEVQDSIHRWERRRTLNKARASRSS 820 830 840 850 860 870 840 850 860 870 880 890 pF1KE4 FQNYLRVAFQEVNSGCTGKTLLVRPYITTEDVCQICAEKFKVGDPEEYSLFLFVDETWQQ :... :.. : .. ..:: : .. .: ::::: : :. . ::..:: : CCDS32 VQDFICVSYLEPEQ--QARTLASRADTQAQALCAQCAEKFAVERPQAHRLFVLVDGRCFQ 880 890 900 910 920 930 900 910 920 930 940 pF1KE4 LAEDTYPQKIKAEL-HSRPQPHIFHFVYKRIKNDPYGIIFQNGEEDLTTS ::.:. :. ::. : .:.:. :::::. CCDS32 LADDALPHCIKGYLLRSEPKRD-FHFVYRPLDGGGGGGGGSPPCLVVREPNFL 940 950 960 970 980 >>CCDS31614.1 RIN1 gene_id:9610|Hs108|chr11 (783 aa) initn: 1094 init1: 460 opt: 715 Z-score: 447.9 bits: 94.0 E(32554): 1.2e-18 Smith-Waterman score: 1118; 32.5% identity (56.1% similar) in 802 aa overlap (133-924:56-703) 110 120 130 140 150 160 pF1KE4 MVRHKDGGYSEEEDVKTCARDSGYDSLSNRLSILDRLLHTHPIWLQLSLSEEEAAEVLQA .:. .::: :.:.::::. . : ..:.. CCDS31 AREKPAQDPLYDVPNASGGQAGGPQRPGRVVSLRERLLLTRPVWLQLQANAAAALHMLRT 30 40 50 60 70 80 170 180 190 200 210 220 pF1KE4 QPPGIFLVHKSTKMQKKVLSLRLPCEFGAPL-KEFAIKESTYTFSLEGSGISFADLFRLI .::: :::.::. : ..: .::: : . . : :: ::::: . : :: .:: CCDS31 EPPGTFLVRKSNTRQCQALCMRLPEASGPSFVSSHYILESPGGVSLEGSELMFPDLVQLI 90 100 110 120 130 140 230 240 250 260 270 280 pF1KE4 AFYCISRDVLPFTLKLPYAISTAKSEAQLEELAQMGLNFWSSPADSKPPNLPPPHRPLSS :: .::.: . :.:: :: : .. .:: ....:..:::: . : : .. CCDS31 CAYCHTRDILLLPLQLPRAIHHAATHKELEAISHLGIEFWSSSLNIKAQRGP------AG 150 160 170 180 190 290 300 310 320 330 340 pF1KE4 DGVCPASLRQLCLINGVHSIKTRTPSELECSQTNGALCFINPLFLKVHSQDLSGGLKRPS : : :: :.:.:.::. . :..::::.:::: :: : :: . CCDS31 GPVLP----QL---------KARSPQELD-QGTGAALCFFNPLF----PGDL-GPTKREK 200 210 220 230 240 350 360 370 380 390 pF1KE4 -TRTPNANGTERTRSP--PPRPPPPAINSLHTSPRLARTETQTSMPETVNHNKHGNVALP :. .. . .: :: :: ::: . : .:: CCDS31 FKRSFKVRVSTETSSPLSPPAVPPPPV------P-----------------------VLP 250 260 270 400 410 420 430 440 450 pF1KE4 GTKPTP---IPPPRLKKQASFLEAEGGAKTLSGGRPGAGP--ELELGTAGSPGGAPPEAA :. :. .:: .: .. : . : .. .:. :. : :. :::... :.. CCDS31 GAVPSQTERLPPCQLLRRESSV----GYRVPAGSGPSLPPMPSLQEVDCGSPSSSEEEGV 280 290 300 310 320 460 470 480 490 500 510 pF1KE4 PGDCTRAPPPSSESRPPCHGGRQRLSDMSISTSSSDSLEFDRSMPLFGYEADTNSSLEDY :: .:. : .: : : ::.: :: CCDS31 PG--SRGSPATS----P-HLGRRR--------------------PL-------------- 330 340 520 530 540 550 560 570 pF1KE4 EGESDQETMAPPIKSKKKRSSSFVLPKLVKSQLQKVSGVFSSFMTPEKRMVRRIAELSRD :...:..: :...::... : : : .: CCDS31 --------------------------------LRSMSAAFCSLLAPERQVGRAAAALMQD 350 360 370 580 590 600 610 620 630 pF1KE4 KCTYFGCLVQDYVSFLQENKECHVSSTDMLQTIRQFMTQVKNYLSQSSELDPPIESLIPE . : : :::: .. .. . : . :: ::: ..... .:: .:: : :.:. CCDS31 RHTAAGQLVQDLLTQVRAGPE-----PQELQGIRQALSRARAMLS--AELGP--EKLLSP 380 390 400 410 420 640 650 660 670 680 690 pF1KE4 DQIDVVLEKAMHKCILKPLKGHVEAMLKDFHMADGSWKQLKENLQLVRQRNPQELGVFAP ... ::::..: .::::. . : :. :::: .: :.:.:.: ..: .: CCDS31 KRLEHVLEKSLHCSVLKPLRPILAARLRRRLAADGSLGRLAEGLRLARAQGPGAFGSHLS 430 440 450 460 470 480 700 710 720 730 740 750 pF1KE4 TPDFVDVEKIKVKFMTMQKMYSPEKKVMLLLRVCKLIYTVMENNSGRMYGADDFLPVLTY :. :..:... :.. . . ::: .: ::..:::.: ..... :. :::.:::.:. CCDS31 LPSPVELEQVRQKLLQLLRTYSPSAQVKRLLQACKLLYMALRTQEGEGAGADEFLPLLSL 490 500 510 520 530 540 760 770 780 790 800 810 pF1KE4 VIAQCDMLELDTEIEYMMELLDPSLLHGEGGYYLTSAYGALSLIKNFQEEQAARLLS-SE :.:.::. :: : ::: :::.:::: ::::::::: ..:.:.... . .. : .: CCDS31 VLAHCDLPELLLEAEYMSELLEPSLLTGEGGYYLTSLSASLALLSGLGQAHTLPLSPVQE 550 560 570 580 590 600 820 830 840 850 860 870 pF1KE4 TRDTLRQWHKRRTTNRTIPSVDDFQNYLRVAFQEVNSGCTGKTLLVRPYITTEDVCQICA : .: :..:: .:.. ::. ::::.:. .::::.::: : : . . :.:: CCDS31 LRRSLSLWEQRR-----LPATHCFQHLLRVAYQDPSSGCTSKTLAVPPEASIATLNQLCA 610 620 630 640 650 660 880 890 900 910 920 930 pF1KE4 EKFKVGDPEEYSLFLFVDETWQQLAEDTYPQKIKAELHSRPQPHIFHFVYKRIKNDPYGI ::.: .:. ..:::. .. ...: . ... : ..::.: CCDS31 TKFRVTQPNTFGLFLYKEQGYHRLPPGALAHRL---------PTTGYLVYRRAEWPETQG 670 680 690 700 710 940 pF1KE4 IFQNGEEDLTTS CCDS31 AVTEEEGSGQSEARSRGEEQGCQGDGDAGVKASPRDIREQSETTAEGGQGQAQEGPAQPG 720 730 740 750 760 770 944 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 02:26:22 2016 done: Sun Nov 6 02:26:23 2016 Total Scan time: 4.630 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]