FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3908, 551 aa 1>>>pF1KE3908 551 - 551 aa - 551 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5568+/-0.00105; mu= 16.6890+/- 0.063 mean_var=67.5050+/-13.630, 0's: 0 Z-trim(103.6): 91 B-trim: 3 in 1/48 Lambda= 0.156101 statistics sampled from 7393 (7487) to 7393 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.587), E-opt: 0.2 (0.23), width: 16 Scan time: 3.140 The best scores are: opt bits E(32554) CCDS9411.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 551) 3736 850.9 0 CCDS73572.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 556) 3649 831.3 0 CCDS73571.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 527) 3585 816.9 0 CCDS9418.1 RCBTB1 gene_id:55213|Hs108|chr13 ( 531) 2619 599.3 3.7e-171 CCDS73570.1 RCBTB2 gene_id:1102|Hs108|chr13 ( 277) 1619 374.0 1.3e-103 CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 535 129.9 5.1e-30 CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861) 547 133.1 7.4e-30 CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 535 130.1 1.3e-29 CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 ( 979) 533 129.7 1.6e-29 CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049) 533 129.7 1.7e-29 CCDS41533.1 HERC4 gene_id:26091|Hs108|chr10 (1057) 533 129.7 1.8e-29 CCDS10021.1 HERC2 gene_id:8924|Hs108|chr15 (4834) 534 130.2 5.6e-29 CCDS54777.1 HERC6 gene_id:55008|Hs108|chr4 ( 986) 473 116.1 1.9e-25 CCDS47098.1 HERC6 gene_id:55008|Hs108|chr4 (1022) 473 116.1 2e-25 CCDS3630.1 HERC5 gene_id:51191|Hs108|chr4 (1024) 429 106.2 1.9e-22 CCDS64683.1 RCC1L gene_id:81554|Hs108|chr7 ( 454) 374 93.7 5.1e-19 CCDS5577.1 RCC1L gene_id:81554|Hs108|chr7 ( 464) 374 93.7 5.2e-19 CCDS7828.1 SERGEF gene_id:26297|Hs108|chr11 ( 458) 354 89.2 1.2e-17 CCDS32597.1 NEK8 gene_id:284086|Hs108|chr17 ( 692) 325 82.7 1.5e-15 CCDS14246.1 RPGR gene_id:6103|Hs108|chrX ( 815) 296 76.2 1.6e-13 CCDS64684.1 RCC1L gene_id:81554|Hs108|chr7 ( 358) 290 74.7 2e-13 CCDS35229.1 RPGR gene_id:6103|Hs108|chrX (1152) 296 76.3 2.2e-13 CCDS181.1 RCC2 gene_id:55920|Hs108|chr1 ( 522) 260 68.1 3.1e-11 >>CCDS9411.1 RCBTB2 gene_id:1102|Hs108|chr13 (551 aa) initn: 3736 init1: 3736 opt: 3736 Z-score: 4545.6 bits: 850.9 E(32554): 0 Smith-Waterman score: 3736; 100.0% identity (100.0% similar) in 551 aa overlap (1-551:1-551) 10 20 30 40 50 60 pF1KE3 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 TTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLATTEGEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 TTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLATTEGEV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 FTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 FTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 SGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNGQLGLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNGQLGLG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 NSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 NSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 TPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 TPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 ATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIRCEHFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 ATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIRCEHFR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 SSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRLKKLCQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 SSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRLKKLCQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 QTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDLLKNFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 QTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDLLKNFI 490 500 510 520 530 540 550 pF1KE3 SKASRVGAFKN ::::::::::: CCDS94 SKASRVGAFKN 550 >>CCDS73572.1 RCBTB2 gene_id:1102|Hs108|chr13 (556 aa) initn: 3649 init1: 3649 opt: 3649 Z-score: 4439.7 bits: 831.3 E(32554): 0 Smith-Waterman score: 3649; 100.0% identity (100.0% similar) in 538 aa overlap (14-551:19-556) 10 20 30 40 50 pF1KE3 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAG :::::::::::::::::::::::::::::::::::::::::: CCDS73 MSALPRDLELSNPREKLTKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 NEVLYTTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NEVLYTTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLAT 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 TEGEVFTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TEGEVFTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 WGYNNSGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 WGYNNSGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE3 QLGLGNSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 QLGLGNSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKS 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE3 NQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDD 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 VFACFATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 VFACFATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIR 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE3 CEHFRSSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 CEHFRSSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE3 KKLCQQTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KKLCQQTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDL 490 500 510 520 530 540 540 550 pF1KE3 LKNFISKASRVGAFKN :::::::::::::::: CCDS73 LKNFISKASRVGAFKN 550 >>CCDS73571.1 RCBTB2 gene_id:1102|Hs108|chr13 (527 aa) initn: 3585 init1: 3585 opt: 3585 Z-score: 4362.1 bits: 816.9 E(32554): 0 Smith-Waterman score: 3585; 100.0% identity (100.0% similar) in 527 aa overlap (25-551:1-527) 10 20 30 40 50 60 pF1KE3 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLY :::::::::::::::::::::::::::::::::::: CCDS73 MLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLY 10 20 30 70 80 90 100 110 120 pF1KE3 TTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLATTEGEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLATTEGEV 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE3 FTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 FTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNN 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE3 SGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNGQLGLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNGQLGLG 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE3 NSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYP 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE3 TPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACF 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE3 ATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIRCEHFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIRCEHFR 340 350 360 370 380 390 430 440 450 460 470 480 pF1KE3 SSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRLKKLCQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRLKKLCQ 400 410 420 430 440 450 490 500 510 520 530 540 pF1KE3 QTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDLLKNFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 QTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDLLKNFI 460 470 480 490 500 510 550 pF1KE3 SKASRVGAFKN ::::::::::: CCDS73 SKASRVGAFKN 520 >>CCDS9418.1 RCBTB1 gene_id:55213|Hs108|chr13 (531 aa) initn: 2037 init1: 2037 opt: 2619 Z-score: 3186.3 bits: 599.3 E(32554): 3.7e-171 Smith-Waterman score: 2619; 70.4% identity (89.3% similar) in 531 aa overlap (25-551:1-531) 10 20 30 40 50 60 pF1KE3 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLY :.::::::::.: : .:. ::.:::::....:.:: CCDS94 MVDVGKWPIFTLLSPQEIASIRKACVFGTSASEALY 10 20 30 70 80 90 100 110 120 pF1KE3 TTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSGPHIVLATTEGEV .: :::.::.: : .::: :: :::. :..:..: :::: ::::::::..:.: .: : CCDS94 VTDNDEVFVFGLNYSNCLGTGDNQSTLVPKKLEGLCGKKIKSLSYGSGPHVLLSTEDGVV 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE3 FTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNN ..::::.::::::::::.:..: .. ::: :::.::::::.::..:..::::::::::: CCDS94 YAWGHNGYSQLGNGTTNQGIAPVQVCTNLLIKQVVEVACGSHHSMALAADGEVFAWGYNN 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE3 SGQVGSGSTVNQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNGNGQLGLG ::::::::.::: ::.::.::. : :: ::::: :::.:.:::: :::::::::::: CCDS94 CGQVGSGSTANQPTPRKVTNCLHIKRVVGIACGQTSSMAVLDNGEVYGWGYNGNGQLGLG 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE3 NSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYP :.::: :: :::::... :....:::::::.::::: .::::::.:::::::::.: : CCDS94 NNGNQLTPVRVAALHSVCVNQIVCGYAHTLALTDEGLLYAWGANTYGQLGTGNKNNLLSP 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE3 TPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACF . . :::.:..:::::::.::::::::::::::::::::::::::::::::::::::::: CCDS94 AHIMVEKERVVEIAACHSAHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACF 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE3 ATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIRCEHFR :::::.::::::: .: ::::::::.:::.:.:::::: .:::::..::..::::::::: CCDS94 ATPAVSWRLLSVEHEDFLTVAESLKKEFDSPETADLKFRIDGKYIHVHKAVLKIRCEHFR 340 350 360 370 380 390 430 440 450 460 470 pF1KE3 SSLED--NED--DIVEMSEFSYPVYRAFLEYLYTDSISLSPEEAVGLLDLATFYRENRLK : ... ::: ...:...::::::::::.:::::...: ::.:.::::::: : ::::: CCDS94 SMFQSYWNEDMKEVIEIDQFSYPVYRAFLQYLYTDTVDLPPEDAIGLLDLATSYCENRLK 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE3 KLCQQTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHLTVVTQTSGFAEMDHDLL ::::. ::.:: :::..:.::::.:::.:::::::.::::::: ::::..: .:: :: CCDS94 KLCQHIIKRGITVENAFSLFSAAVRYDAEDLEEFCFKFCINHLTEVTQTAAFWQMDGPLL 460 470 480 490 500 510 540 550 pF1KE3 KNFISKASRVGAFKN :.::.:::. ::::: CCDS94 KEFIAKASKCGAFKN 520 530 >>CCDS73570.1 RCBTB2 gene_id:1102|Hs108|chr13 (277 aa) initn: 1619 init1: 1619 opt: 1619 Z-score: 1973.6 bits: 374.0 E(32554): 1.3e-103 Smith-Waterman score: 1619; 100.0% identity (100.0% similar) in 242 aa overlap (310-551:36-277) 280 290 300 310 320 330 pF1KE3 AWGANSYGQLGTGNKSNQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQCRG :::::::::::::::::::::::::::::: CCDS73 TETGSLDSATVATSQPLAEWQLCKASVSRGIIEIAACHSTHTSAAKTQGGHVYMWGQCRG 10 20 30 40 50 60 340 350 360 370 380 390 pF1KE3 QSVILPHLTHFSCTDDVFACFATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 QSVILPHLTHFSCTDDVFACFATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFL 70 80 90 100 110 120 400 410 420 430 440 450 pF1KE3 VDGKYIYAHKVLLKIRCEHFRSSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 VDGKYIYAHKVLLKIRCEHFRSSLEDNEDDIVEMSEFSYPVYRAFLEYLYTDSISLSPEE 130 140 150 160 170 180 460 470 480 490 500 510 pF1KE3 AVGLLDLATFYRENRLKKLCQQTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 AVGLLDLATFYRENRLKKLCQQTIKQGICEENAIALLSAAVKYDAQDLEEFCFRFCINHL 190 200 210 220 230 240 520 530 540 550 pF1KE3 TVVTQTSGFAEMDHDLLKNFISKASRVGAFKN :::::::::::::::::::::::::::::::: CCDS73 TVVTQTSGFAEMDHDLLKNFISKASRVGAFKN 250 260 270 >>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa) initn: 666 init1: 414 opt: 535 Z-score: 652.3 bits: 129.9 E(32554): 5.1e-30 Smith-Waterman score: 537; 30.5% identity (58.5% similar) in 347 aa overlap (25-356:1-341) 10 20 30 40 50 pF1KE3 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIR---QACVFGS---- :: : : . . .:: : :.: : : CCDS82 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSV 10 20 30 60 70 80 90 100 pF1KE3 -----AGNEVLYTTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSG .::. .. . :... : : : :: . .:... .: ..: .. : . CCDS82 KEVACGGNHSVFLLEDGEVYTCGLNTKG--QLGHEREGNKPEQIGALADQHIIHVACGES 40 50 60 70 80 90 110 120 130 140 150 160 pF1KE3 PHIVLATTEGEVFTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLT : . . .:..:.:: .. .::: ::. ... .. .:... ...:.::..: :.:. CCDS82 -HSLALSDRGQLFSWGAGSDGQLGLMTTEDSVAVPRLIQKLNQQTILQVSCGNWHCLALA 100 110 120 130 140 150 170 180 190 200 210 220 pF1KE3 SDGEVFAWGYNNSGQVGSGSTV-NQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVY .::. :.:: :. ::.: :. .: :.:: . :.. .. .: : .:. .: :. CCDS82 ADGQFFTWGKNSHGQLGLGKEFPSQASPQRVRS-LEGIPLAQVAAGGAHSFALSLSGAVF 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE3 VWGYNGNGQLGLGNSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYG ::.:. :::::.. .. .::.: :. .: ..:: :: ::: : :...::.: : CCDS82 GWGMNNAGQLGLSDEKDRESPCHVKLLRTQKVVYISCGEEHTAVLTKSGGVFTFGAGSCG 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE3 QLGTGNKSNQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQC--RGQSVILP ::: . ... : : . :: :: : ..: .: .: : ::: . CCDS82 QLGHDSMNDEVNPRRVLELMGSEVTQIACGRQHTLAFVPSSGLIYAFG-CGARGQ-LGTG 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE3 HLTHFSCTDDVFACFATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYI : . .: . : CCDS82 HTCNVKCPSPVKGYWAAHSGQLSARAGKNDCLWNLKVF 340 350 360 >>CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861 aa) initn: 621 init1: 360 opt: 547 Z-score: 649.5 bits: 133.1 E(32554): 7.4e-30 Smith-Waterman score: 547; 33.2% identity (62.5% similar) in 307 aa overlap (47-349:4030-4330) 20 30 40 50 60 70 pF1KE3 QATLSSLKMLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLYTTVNDEIFVLGTNCCG : . :. : .. .: ... : . : CCDS45 YLWGAGRHGQLAEAGRNVMVPAAAPSFSQAQQVICGQ--NCTFVIQANGTVLACGEGSYG 4000 4010 4020 4030 4040 4050 80 90 100 110 120 130 pF1KE3 CLGLGDVQSTIEPRRLDSLNGKKIACL--SYGSGPHIVLATTEGEVFTWGHNAYSQLGNG :: :. .. ...:.: .. : : :: : . : ::::.:: . :..::.: CCDS45 RLGQGNSDDLHVLTVISALQGFVVTQLVTSCGSDGHSMALTESGEVFSWGDGDYGKLGHG 4060 4070 4080 4090 4100 4110 140 150 160 170 180 190 pF1KE3 TTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNNSGQVGSGSTVNQPI .... : .: . :....:....:: :: :.::::..:..: .. :..: :.: :. . CCDS45 NSDRQRRPRQIEA-LQGEEVVQMSCGFKHSAVVTSDGKLFTFGNGDYGRLGLGNTSNKKL 4120 4130 4140 4150 4160 4170 200 210 220 230 240 250 pF1KE3 PRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVYVWGY-NGN-GQLGLGNSGNQPTPCRVA :.:::. :.. . .::: .:: : . ::.. .:. :.:::::: . .: .. CCDS45 PERVTA-LEGYQIGQVACGLNHTLAVSADGSM-VWAFGDGDYGKLGLGNSTAKSSPQKID 4180 4190 4200 4210 4220 4230 260 270 280 290 300 310 pF1KE3 ALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYPTPVTVEKDRIIE .: :: ...:::: ...:: .:.::..: . : : :.. : . : ::: CCDS45 VLCGIGIKKVACGTQFSVALTKDGHVYTFGQDRLIGLPEGRARNHNRPQQIPVLAGVIIE 4240 4250 4260 4270 4280 4290 320 330 340 350 360 370 pF1KE3 IAACHSTHTSAAKTQGGHVYMWGQCRGQSVILPHLTHFSCTDDVFACFATPAVTWRLLSV .: . :: : ..: :: ::. .. : : .: CCDS45 DVAVGAEHTLALASNGD-VYAWGSNSEGQLGLGHTNHVREPTLVTGLQGKNVRQISAGRC 4300 4310 4320 4330 4340 4350 380 390 400 410 420 430 pF1KE3 EPDDHLTVAESLKREFDNPDTADLKFLVDGKYIYAHKVLLKIRCEHFRSSLEDNEDDIVE CCDS45 HSAAWTAPPVPPRAPGVSVPLQLGLPDTVPPQYGALREVSIHTVRARLRLLYHFSDLMYS 4360 4370 4380 4390 4400 4410 >-- initn: 586 init1: 261 opt: 489 Z-score: 578.9 bits: 120.1 E(32554): 6.3e-26 Smith-Waterman score: 489; 34.0% identity (60.3% similar) in 300 aa overlap (54-340:410-699) 30 40 50 60 70 80 pF1KE3 KMLDVGKWPIFSLCSEEELQLIRQACVFGSAGNEVLYTTVND-EIFVLGTNCCGCLGLGD ::. .. .: . . : . : ::::: CCDS45 NSSHQLVEGTQEKILQPKLAPSFSDAQTIEAGQYCTFVISTDGSVRACGKGSYGRLGLGD 380 390 400 410 420 430 90 100 110 120 130 140 pF1KE3 V--QSTIEPRRLDSLNGKKIACLSYGSGPHIVLATTEGEVFTWGHNAYSQLGNGTTNHGL :::.. .. . : . : :: : . :::::::.:: . :..::.:... CCDS45 SNNQSTLKKLTFEPHRSIKKVSSSKGSDGHTLAFTTEGEVFSWGDGDYGKLGHGNSSTQK 440 450 460 470 480 490 150 160 170 180 190 200 pF1KE3 VPCHISTNLSNKQVIEVACGSYHSLVLTSDGEVFAWGYNNSGQVGSGSTVNQPIPRRVTG : :. :..: :. :. : :: ..: :::...:: .. :..: :.. .. :: : CCDS45 YPKLIQGPLQGKVVVCVSAGYRHSAAVTEDGELYTWGEGDFGRLGHGDSNSRNIPTLVKD 500 510 520 530 540 550 210 220 230 240 250 pF1KE3 CLQNKVVVTIACGQMCCMAVVDTGEVYVWGYNG--NGQLGLGNSGNQPTPCRVAALQGIR ..: : ..::. .:. :.. ::...: ::.:: :... : . ::::. CCDS45 -ISN--VGEVSCGSSHTIALSKDGRT-VWSFGGGDNGKLGHGDTNRVYKPKVIEALQGMF 560 570 580 590 600 610 260 270 280 290 300 310 pF1KE3 VQRVACGYAHTLVLTDEGQVYAWGANSYGQLGTGNKSNQSYPTPVTVEK---DRIIEIAA ...: : .:.::. ::::::: .. :: :. :. . : .:. ::.... CCDS45 IRKVCAGSQSSLALTSTGQVYAWGCGAC--LGCGS-SEATALRPKLIEELAATRIVDVSI 620 630 640 650 660 670 320 330 340 350 360 370 pF1KE3 CHSTHTSAAKTQGGHVYMWG-----QCRGQSVILPHLTHFSCTDDVFACFATPAVTWRLL : : : .. ..:: :: :: :: CCDS45 GDS-HC-LALSHDNEVYAWGNNSMGQC-GQGNSTGPITKPKKVSGLDGIAIQQISAGTSH 680 690 700 710 720 >>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa) initn: 666 init1: 414 opt: 535 Z-score: 645.3 bits: 130.1 E(32554): 1.3e-29 Smith-Waterman score: 537; 30.5% identity (58.5% similar) in 347 aa overlap (25-356:1-341) 10 20 30 40 50 pF1KE3 MEEELPLFSGDSGKPVQATLSSLKMLDVGKWPIFSLCSEEELQLIR---QACVFGS---- :: : : . . .:: : :.: : : CCDS34 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSV 10 20 30 60 70 80 90 100 pF1KE3 -----AGNEVLYTTVNDEIFVLGTNCCGCLGLGDVQSTIEPRRLDSLNGKKIACLSYGSG .::. .. . :... : : : :: . .:... .: ..: .. : . CCDS34 KEVACGGNHSVFLLEDGEVYTCGLNTKG--QLGHEREGNKPEQIGALADQHIIHVACGES 40 50 60 70 80 90 110 120 130 140 150 160 pF1KE3 PHIVLATTEGEVFTWGHNAYSQLGNGTTNHGLVPCHISTNLSNKQVIEVACGSYHSLVLT : . . .:..:.:: .. .::: ::. ... .. .:... ...:.::..: :.:. CCDS34 -HSLALSDRGQLFSWGAGSDGQLGLMTTEDSVAVPRLIQKLNQQTILQVSCGNWHCLALA 100 110 120 130 140 150 170 180 190 200 210 220 pF1KE3 SDGEVFAWGYNNSGQVGSGSTV-NQPIPRRVTGCLQNKVVVTIACGQMCCMAVVDTGEVY .::. :.:: :. ::.: :. .: :.:: . :.. .. .: : .:. .: :. CCDS34 ADGQFFTWGKNSHGQLGLGKEFPSQASPQRVRS-LEGIPLAQVAAGGAHSFALSLSGAVF 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE3 VWGYNGNGQLGLGNSGNQPTPCRVAALQGIRVQRVACGYAHTLVLTDEGQVYAWGANSYG ::.:. :::::.. .. .::.: :. .: ..:: :: ::: : :...::.: : CCDS34 GWGMNNAGQLGLSDEKDRESPCHVKLLRTQKVVYISCGEEHTAVLTKSGGVFTFGAGSCG 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE3 QLGTGNKSNQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGGHVYMWGQC--RGQSVILP ::: . ... : : . :: :: : ..: .: .: : ::: . CCDS34 QLGHDSMNDEVNPRRVLELMGSEVTQIACGRQHTLAFVPSSGLIYAFG-CGARGQ-LGTG 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE3 HLTHFSCTDDVFACFATPAVTWRLLSVEPDDHLTVAESLKREFDNPDTADLKFLVDGKYI : . .: . : CCDS34 HTCNVKCPSPVKGYWAAHSGQLSARADRFKYHIVKQIFSGGDQTFVLCSKYENYSPAVDF 340 350 360 370 380 390 >>CCDS60541.1 HERC4 gene_id:26091|Hs108|chr10 (979 aa) initn: 452 init1: 452 opt: 533 Z-score: 643.3 bits: 129.7 E(32554): 1.6e-29 Smith-Waterman score: 533; 34.4% identity (64.1% similar) in 276 aa overlap (67-335:47-320) 40 50 60 70 80 90 pF1KE3 CSEEELQLIRQACVFGSAGNEVLYTTVNDEIFVL--GT-NCCGC--LG-LGDVQSTIEPR .::: :: ::: :: :: .: .:. CCDS60 IDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGCNDLGQLGHEKSRKKPE 20 30 40 50 60 70 100 110 120 130 140 pF1KE3 RLDSLNGKKIACLSYGSGPHIVLATTEGEVFTWGHNAYSQLG-NGTTNHGLVPCHISTNL .. .:....:. .: : . : . . .:.:..:: .. .::: :. . :: .:.. : CCDS60 QVVALDAQNIVAVSCGEA-HTLALNDKGQVYAWGLDSDGQLGLVGSEECIRVPRNIKS-L 80 90 100 110 120 130 150 160 170 180 190 200 pF1KE3 SNKQVIEVACGSYHSLVLTSDGEVFAWGYNNSGQVGSGSTVNQPIPRRVTGCLQNKVVVT :. :...:::: ::::.:.. .::: :: :. ::.: :. .. .. : . . CCDS60 SDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTSPQLLKSLLGIPFMQ 140 150 160 170 180 190 210 220 230 240 250 260 pF1KE3 IACGQMCCMAVVDTGEVYVWGYNGNGQLGLGNSGNQPTPCRVAALQGIRVQRVACGYAHT .: : .... .: .. :: : :::::.. ... .: . .:.. .. . :: :: CCDS60 VAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLRSQKIVYICCGEDHT 200 210 220 230 240 250 270 280 290 300 310 320 pF1KE3 LVLTDEGQVYAWGANSYGQLGTGNKSNQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGG .:: :: :...::..::::: .. :.. : : :. :: :::: ..: CCDS60 AALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIACGRQHTSAFVPSSG 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE3 HVYMWGQCRGQSVILPHLTHFSCTDDVFACFATPAVTWRLLSVEPDDHLTVAESLKREFD ..: .: CCDS60 RIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEEYFCVKRIFSGGDQS 320 330 340 350 360 370 >>CCDS7274.1 HERC4 gene_id:26091|Hs108|chr10 (1049 aa) initn: 452 init1: 452 opt: 533 Z-score: 642.8 bits: 129.7 E(32554): 1.7e-29 Smith-Waterman score: 533; 34.4% identity (64.1% similar) in 276 aa overlap (67-335:47-320) 40 50 60 70 80 90 pF1KE3 CSEEELQLIRQACVFGSAGNEVLYTTVNDEIFVL--GT-NCCGC--LG-LGDVQSTIEPR .::: :: ::: :: :: .: .:. CCDS72 IDEEIVLEPRKSDFFINKRVRDVGCGLRHTVFVLDDGTVYTCGCNDLGQLGHEKSRKKPE 20 30 40 50 60 70 100 110 120 130 140 pF1KE3 RLDSLNGKKIACLSYGSGPHIVLATTEGEVFTWGHNAYSQLG-NGTTNHGLVPCHISTNL .. .:....:. .: : . : . . .:.:..:: .. .::: :. . :: .:.. : CCDS72 QVVALDAQNIVAVSCGEA-HTLALNDKGQVYAWGLDSDGQLGLVGSEECIRVPRNIKS-L 80 90 100 110 120 130 150 160 170 180 190 200 pF1KE3 SNKQVIEVACGSYHSLVLTSDGEVFAWGYNNSGQVGSGSTVNQPIPRRVTGCLQNKVVVT :. :...:::: ::::.:.. .::: :: :. ::.: :. .. .. : . . CCDS72 SDIQIVQVACGYYHSLALSKASEVFCWGQNKYGQLGLGTDCKKQTSPQLLKSLLGIPFMQ 140 150 160 170 180 190 210 220 230 240 250 260 pF1KE3 IACGQMCCMAVVDTGEVYVWGYNGNGQLGLGNSGNQPTPCRVAALQGIRVQRVACGYAHT .: : .... .: .. :: : :::::.. ... .: . .:.. .. . :: :: CCDS72 VAAGGAHSFVLTLSGAIFGWGRNKFGQLGLNDENDRYVPNLLKSLRSQKIVYICCGEDHT 200 210 220 230 240 250 270 280 290 300 310 320 pF1KE3 LVLTDEGQVYAWGANSYGQLGTGNKSNQSYPTPVTVEKDRIIEIAACHSTHTSAAKTQGG .:: :: :...::..::::: .. :.. : : :. :: :::: ..: CCDS72 AALTKEGGVFTFGAGGYGQLGHNSTSHEINPRKVFELMGSIVTEIACGRQHTSAFVPSSG 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE3 HVYMWGQCRGQSVILPHLTHFSCTDDVFACFATPAVTWRLLSVEPDDHLTVAESLKREFD ..: .: CCDS72 RIYSFGLGGNGQLGTGSTSNRKSPFTVKGNWYPYNGQCLPDIDSEEYFCVKRIFSGGDQS 320 330 340 350 360 370 551 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 09:03:37 2016 done: Sun Nov 6 09:03:38 2016 Total Scan time: 3.140 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]