FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8339, 310 aa
1>>>pF1KB8339 310 - 310 aa - 310 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8549+/-0.000848; mu= 9.6994+/- 0.051
mean_var=111.4415+/-22.077, 0's: 0 Z-trim(110.4): 57 B-trim: 3 in 1/51
Lambda= 0.121493
statistics sampled from 11524 (11580) to 11524 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.723), E-opt: 0.2 (0.356), width: 16
Scan time: 2.270
The best scores are: opt bits E(32554)
CCDS1214.1 USF1 gene_id:7391|Hs108|chr1 ( 310) 2006 361.9 3.6e-100
CCDS12453.1 USF2 gene_id:7392|Hs108|chr19 ( 279) 756 142.8 3e-34
CCDS12452.1 USF2 gene_id:7392|Hs108|chr19 ( 346) 756 142.8 3.5e-34
CCDS82329.1 USF2 gene_id:7392|Hs108|chr19 ( 215) 681 129.6 2.2e-30
>>CCDS1214.1 USF1 gene_id:7391|Hs108|chr1 (310 aa)
initn: 2006 init1: 2006 opt: 2006 Z-score: 1911.9 bits: 361.9 E(32554): 3.6e-100
Smith-Waterman score: 2006; 100.0% identity (100.0% similar) in 310 aa overlap (1-310:1-310)
10 20 30 40 50 60
pF1KB8 MKGQQKTAETEEGTVQIQEGAVATGEDPTSVAIASIQSAATFPDPNVKYVFRTENGGQVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MKGQQKTAETEEGTVQIQEGAVATGEDPTSVAIASIQSAATFPDPNVKYVFRTENGGQVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 YRVIQVSEGQLDGQTEGTGAISGYPATQSMTQAVIQGAFTSDDAVDTEGTAAETHYTYFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 YRVIQVSEGQLDGQTEGTGAISGYPATQSMTQAVIQGAFTSDDAVDTEGTAAETHYTYFP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 STAVGDGAGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 STAVGDGAGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 RTHPYSPKSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RTHPYSPKSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 GGILSKACDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGILSKACDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHG
250 260 270 280 290 300
310
pF1KB8 LEVVIKNDSN
::::::::::
CCDS12 LEVVIKNDSN
310
>>CCDS12453.1 USF2 gene_id:7392|Hs108|chr19 (279 aa)
initn: 909 init1: 749 opt: 756 Z-score: 728.4 bits: 142.8 E(32554): 3e-34
Smith-Waterman score: 891; 51.2% identity (73.6% similar) in 303 aa overlap (4-304:22-273)
10 20 30 40
pF1KB8 MKGQQKTAETEEGTVQIQEGAVATG-EDPTSVAIASIQSAAT
..: :.::: :..:::. . : :. :.:::.:.:.::
CCDS12 MDMLDPGLDPAASATAAAAASHDKGPEAEEG-VELQEGGDGPGAEEQTAVAITSVQQAA-
10 20 30 40 50
50 60 70 80 90 100
pF1KB8 FPDPNVKYVFRTE-NGGQVMYRVIQVSEGQLDGQTEGTGAISGYPATQSMTQAVIQGAFT
: : :..: :::: :::: ::::. :.
CCDS12 FGDHNIQYQFRTETNGGQ----------------------------------AVIQNPFS
60 70 80
110 120 130 140 150 160
pF1KB8 SDDAVDTEGTAAETHYTYFPSTAVGDGAGGTTSGSTAAVVTTQGSEALLGQATPPGTGQF
. . .:....:....:::...::: .:: :..: .. :. : :::
CCDS12 NGGSPAAEAVSGEARFAYFPASSVGD--------TTA--VSVQTTD----QSLQAG-GQF
90 100 110 120
170 180 190 200 210 220
pF1KB8 FVMMSPQEVLQGGSQRSIAPRTHPYSPKSEAPRTTRDEKRRAQHNEVERRRRDKINNWIV
.:::.::.::: :.::.::::::::::: .. :: :::.:::::::::::::::::::::
CCDS12 YVMMTPQDVLQTGTQRTIAPRTHPYSPKIDGTRTPRDERRRAQHNEVERRRRDKINNWIV
130 140 150 160 170 180
230 240 250 260 270 280
pF1KB8 QLSKIIPDCSMESTKSGQSKGGILSKACDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQ
:::::::::. ...:.: :::::::::::::.::::.:.:..: .. ..::.::..:::
CCDS12 QLSKIIPDCNADNSKTGASKGGILSKACDYIRELRQTNQRMQETFKEAERLQMDNELLRQ
190 200 210 220 230 240
290 300 310
pF1KB8 QVEDLKNKNLLLRAQLRHHGLEVVIKNDSN
:.:.:::.: ::::::..:.::.:
CCDS12 QIEELKNENALLRAQLQQHNLEMVGEGTRQ
250 260 270
>>CCDS12452.1 USF2 gene_id:7392|Hs108|chr19 (346 aa)
initn: 1000 init1: 749 opt: 756 Z-score: 727.0 bits: 142.8 E(32554): 3.5e-34
Smith-Waterman score: 1005; 51.5% identity (74.7% similar) in 336 aa overlap (4-304:22-340)
10 20 30 40
pF1KB8 MKGQQKTAETEEGTVQIQEGAVATG-EDPTSVAIASIQSAAT
..: :.::: :..:::. . : :. :.:::.:.:.::
CCDS12 MDMLDPGLDPAASATAAAAASHDKGPEAEEG-VELQEGGDGPGAEEQTAVAITSVQQAA-
10 20 30 40 50
50 60 70 80 90
pF1KB8 FPDPNVKYVFRTE-NGGQVMYRVIQVSEGQLDGQTEGTGAISGYPAT------QSMTQ--
: : :..: :::: ::::: :::.::..:::::: . .::.: .. :..::
CCDS12 FGDHNIQYQFRTETNGGQVTYRVVQVTDGQLDGQGDTAGAVSVVSTAAFAGGQQAVTQVG
60 70 80 90 100 110
100 110 120
pF1KB8 -------------------------AVIQGAFTSDDAVDTEGTAAETHYTYFPSTAVGDG
::::. :.. . .:....:....:::...:::
CCDS12 VDGAAQRPGPAAASVPPGPAAPFPLAVIQNPFSNGGSPAAEAVSGEARFAYFPASSVGD-
120 130 140 150 160 170
130 140 150 160 170 180
pF1KB8 AGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAPRTHPYSP
.:: :..: .. :. : :::.:::.::.::: :.::.::::::::::
CCDS12 -------TTA--VSVQTTD----QSLQAG-GQFYVMMTPQDVLQTGTQRTIAPRTHPYSP
180 190 200 210 220
190 200 210 220 230 240
pF1KB8 KSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSKGGILSKA
: .. :: :::.::::::::::::::::::::::::::::::. ...:.: :::::::::
CCDS12 KIDGTRTPRDERRRAQHNEVERRRRDKINNWIVQLSKIIPDCNADNSKTGASKGGILSKA
230 240 250 260 270 280
250 260 270 280 290 300
pF1KB8 CDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHGLEVVIKN
::::.::::.:.:..: .. ..::.::..::::.:.:::.: ::::::..:.::.:
CCDS12 CDYIRELRQTNQRMQETFKEAERLQMDNELLRQQIEELKNENALLRAQLQQHNLEMVGEG
290 300 310 320 330 340
310
pF1KB8 DSN
CCDS12 TRQ
>>CCDS82329.1 USF2 gene_id:7392|Hs108|chr19 (215 aa)
initn: 762 init1: 672 opt: 681 Z-score: 659.1 bits: 129.6 E(32554): 2.2e-30
Smith-Waterman score: 681; 53.6% identity (77.3% similar) in 207 aa overlap (102-304:9-209)
80 90 100 110 120
pF1KB8 DGQTEGTGAISGYPATQSMTQAVIQGAFTSDDAVDTEGTAAETHYTYFPSTAVG----DG
: :... ..:: .: : . : .:
CCDS82 MDMLDPGLDPAASATAAAAASH-DKGPEAEEGVELQEG
10 20 30
130 140 150 160 170 180
pF1KB8 AGGTTSGSTAAVVTTQGSEALLGQATPPGTGQFFVMMSPQEVLQGGSQRSIAPRTHPYSP
. : . .::. :. ..: .:. . :: . . : :.::.::::::::::
CCDS82 GDGPGAEEQTAVAITSVQQAAFGDHNIQ--YQFRTETNGG---QTGTQRTIAPRTHPYSP
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB8 KSEAPRTTRDEKRRAQHNEVERRRRDKINNWIVQLSKIIPDCSMESTKSGQSKGGILSKA
: .. :: :::.::::::::::::::::::::::::::::::. ...:.: :::::::::
CCDS82 KIDGTRTPRDERRRAQHNEVERRRRDKINNWIVQLSKIIPDCNADNSKTGASKGGILSKA
100 110 120 130 140 150
250 260 270 280 290 300
pF1KB8 CDYIQELRQSNHRLSEELQGLDQLQLDNDVLRQQVEDLKNKNLLLRAQLRHHGLEVVIKN
::::.::::.:.:..: .. ..::.::..::::.:.:::.: ::::::..:.::.:
CCDS82 CDYIRELRQTNQRMQETFKEAERLQMDNELLRQQIEELKNENALLRAQLQQHNLEMVGEG
160 170 180 190 200 210
310
pF1KB8 DSN
CCDS82 TRQ
310 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 11:54:13 2016 done: Fri Nov 4 11:54:13 2016
Total Scan time: 2.270 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]