FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8339, 310 aa 1>>>pF1KB8339 310 - 310 aa - 310 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.8549+/-0.000848; mu= 9.6994+/- 0.051 mean_var=111.4415+/-22.077, 0's: 0 Z-trim(110.4): 57 B-trim: 3 in 1/51 Lambda= 0.121493 statistics sampled from 11524 (11580) to 11524 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.723), E-opt: 0.2 (0.356), width: 16 Scan time: 2.270 The best scores are: opt bits E(32554) CCDS1214.1 USF1 gene_id:7391|Hs108|chr1 ( 310) 2006 361.9 3.6e-100 CCDS12453.1 USF2 gene_id:7392|Hs108|chr19 ( 279) 756 142.8 3e-34 CCDS12452.1 USF2 gene_id:7392|Hs108|chr19 ( 346) 756 142.8 3.5e-34 CCDS82329.1 USF2 gene_id:7392|Hs108|chr19 ( 215) 681 129.6 2.2e-30 >>CCDS1214.1 USF1 gene_id:7391|Hs108|chr1 (310 aa) initn: 2006 init1: 2006 opt: 2006 Z-score: 1911.9 bits: 361.9 E(32554): 3.6e-100 Smith-Waterman score: 2006; 100.0% identity (100.0% similar) in 310 aa overlap (1-310:1-310) 10 20 30 40 50 60 pF1KB8 MKGQQKTAETEEGTVQIQEGAVATGEDPTSVAIASIQSAATFPDPNVKYVFRTENGGQVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MKGQQKTAETEEGTVQIQEGAVATGEDPTSVAIASIQSAATFPDPNVKYVFRTENGGQVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 YRVIQVSEGQLDGQTEGTGAISGYPATQSMTQAVIQGAFTSDDAVDTEGTAAETHYTYFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YRVIQVSEGQLDGQTEGTGAISGYPATQSMTQAVIQGAFTSDDAVDTEGTAAETHYTYFP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 STAVGDGAGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 STAVGDGAGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 RTHPYSPKSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RTHPYSPKSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB8 GGILSKACDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGILSKACDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHG 250 260 270 280 290 300 310 pF1KB8 LEVVIKNDSN :::::::::: CCDS12 LEVVIKNDSN 310 >>CCDS12453.1 USF2 gene_id:7392|Hs108|chr19 (279 aa) initn: 909 init1: 749 opt: 756 Z-score: 728.4 bits: 142.8 E(32554): 3e-34 Smith-Waterman score: 891; 51.2% identity (73.6% similar) in 303 aa overlap (4-304:22-273) 10 20 30 40 pF1KB8 MKGQQKTAETEEGTVQIQEGAVATG-EDPTSVAIASIQSAAT ..: :.::: :..:::. . : :. :.:::.:.:.:: CCDS12 MDMLDPGLDPAASATAAAAASHDKGPEAEEG-VELQEGGDGPGAEEQTAVAITSVQQAA- 10 20 30 40 50 50 60 70 80 90 100 pF1KB8 FPDPNVKYVFRTE-NGGQVMYRVIQVSEGQLDGQTEGTGAISGYPATQSMTQAVIQGAFT : : :..: :::: :::: ::::. :. CCDS12 FGDHNIQYQFRTETNGGQ----------------------------------AVIQNPFS 60 70 80 110 120 130 140 150 160 pF1KB8 SDDAVDTEGTAAETHYTYFPSTAVGDGAGGTTSGSTAAVVTTQGSEALLGQATPPGTGQF . . .:....:....:::...::: .:: :..: .. :. : ::: CCDS12 NGGSPAAEAVSGEARFAYFPASSVGD--------TTA--VSVQTTD----QSLQAG-GQF 90 100 110 120 170 180 190 200 210 220 pF1KB8 FVMMSPQEVLQGGSQRSIAPRTHPYSPKSEAPRTTRDEKRRAQHNEVERRRRDKINNWIV .:::.::.::: :.::.::::::::::: .. :: :::.::::::::::::::::::::: CCDS12 YVMMTPQDVLQTGTQRTIAPRTHPYSPKIDGTRTPRDERRRAQHNEVERRRRDKINNWIV 130 140 150 160 170 180 230 240 250 260 270 280 pF1KB8 QLSKIIPDCSMESTKSGQSKGGILSKACDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQ :::::::::. ...:.: :::::::::::::.::::.:.:..: .. ..::.::..::: CCDS12 QLSKIIPDCNADNSKTGASKGGILSKACDYIRELRQTNQRMQETFKEAERLQMDNELLRQ 190 200 210 220 230 240 290 300 310 pF1KB8 QVEDLKNKNLLLRAQLRHHGLEVVIKNDSN :.:.:::.: ::::::..:.::.: CCDS12 QIEELKNENALLRAQLQQHNLEMVGEGTRQ 250 260 270 >>CCDS12452.1 USF2 gene_id:7392|Hs108|chr19 (346 aa) initn: 1000 init1: 749 opt: 756 Z-score: 727.0 bits: 142.8 E(32554): 3.5e-34 Smith-Waterman score: 1005; 51.5% identity (74.7% similar) in 336 aa overlap (4-304:22-340) 10 20 30 40 pF1KB8 MKGQQKTAETEEGTVQIQEGAVATG-EDPTSVAIASIQSAAT ..: :.::: :..:::. . : :. :.:::.:.:.:: CCDS12 MDMLDPGLDPAASATAAAAASHDKGPEAEEG-VELQEGGDGPGAEEQTAVAITSVQQAA- 10 20 30 40 50 50 60 70 80 90 pF1KB8 FPDPNVKYVFRTE-NGGQVMYRVIQVSEGQLDGQTEGTGAISGYPAT------QSMTQ-- : : :..: :::: ::::: :::.::..:::::: . .::.: .. :..:: CCDS12 FGDHNIQYQFRTETNGGQVTYRVVQVTDGQLDGQGDTAGAVSVVSTAAFAGGQQAVTQVG 60 70 80 90 100 110 100 110 120 pF1KB8 -------------------------AVIQGAFTSDDAVDTEGTAAETHYTYFPSTAVGDG ::::. :.. . .:....:....:::...::: CCDS12 VDGAAQRPGPAAASVPPGPAAPFPLAVIQNPFSNGGSPAAEAVSGEARFAYFPASSVGD- 120 130 140 150 160 170 130 140 150 160 170 180 pF1KB8 AGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAPRTHPYSP .:: :..: .. :. : :::.:::.::.::: :.::.:::::::::: CCDS12 -------TTA--VSVQTTD----QSLQAG-GQFYVMMTPQDVLQTGTQRTIAPRTHPYSP 180 190 200 210 220 190 200 210 220 230 240 pF1KB8 KSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSKGGILSKA : .. :: :::.::::::::::::::::::::::::::::::. ...:.: ::::::::: CCDS12 KIDGTRTPRDERRRAQHNEVERRRRDKINNWIVQLSKIIPDCNADNSKTGASKGGILSKA 230 240 250 260 270 280 250 260 270 280 290 300 pF1KB8 CDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHGLEVVIKN ::::.::::.:.:..: .. ..::.::..::::.:.:::.: ::::::..:.::.: CCDS12 CDYIRELRQTNQRMQETFKEAERLQMDNELLRQQIEELKNENALLRAQLQQHNLEMVGEG 290 300 310 320 330 340 310 pF1KB8 DSN CCDS12 TRQ >>CCDS82329.1 USF2 gene_id:7392|Hs108|chr19 (215 aa) initn: 762 init1: 672 opt: 681 Z-score: 659.1 bits: 129.6 E(32554): 2.2e-30 Smith-Waterman score: 681; 53.6% identity (77.3% similar) in 207 aa overlap (102-304:9-209) 80 90 100 110 120 pF1KB8 DGQTEGTGAISGYPATQSMTQAVIQGAFTSDDAVDTEGTAAETHYTYFPSTAVG----DG : :... ..:: .: : . : .: CCDS82 MDMLDPGLDPAASATAAAAASH-DKGPEAEEGVELQEG 10 20 30 130 140 150 160 170 180 pF1KB8 AGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAPRTHPYSP . : . .::. :. ..: .:. . :: . . : :.::.:::::::::: CCDS82 GDGPGAEEQTAVAITSVQQAAFGDHNIQ--YQFRTETNGG---QTGTQRTIAPRTHPYSP 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB8 KSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSKGGILSKA : .. :: :::.::::::::::::::::::::::::::::::. ...:.: ::::::::: CCDS82 KIDGTRTPRDERRRAQHNEVERRRRDKINNWIVQLSKIIPDCNADNSKTGASKGGILSKA 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB8 CDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHGLEVVIKN ::::.::::.:.:..: .. ..::.::..::::.:.:::.: ::::::..:.::.: CCDS82 CDYIRELRQTNQRMQETFKEAERLQMDNELLRQQIEELKNENALLRAQLQQHNLEMVGEG 160 170 180 190 200 210 310 pF1KB8 DSN CCDS82 TRQ 310 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 11:54:13 2016 done: Fri Nov 4 11:54:13 2016 Total Scan time: 2.270 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]