FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9730, 465 aa
1>>>pF1KB9730 465 - 465 aa - 465 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8750+/-0.000932; mu= 7.3073+/- 0.056
mean_var=189.0560+/-39.634, 0's: 0 Z-trim(112.1): 47 B-trim: 67 in 1/52
Lambda= 0.093278
statistics sampled from 12880 (12912) to 12880 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.741), E-opt: 0.2 (0.397), width: 16
Scan time: 2.920
The best scores are: opt bits E(32554)
CCDS10150.1 ONECUT1 gene_id:3175|Hs108|chr15 ( 465) 3225 446.4 3e-125
CCDS42440.1 ONECUT2 gene_id:9480|Hs108|chr18 ( 504) 1849 261.3 1.7e-69
CCDS45900.1 ONECUT3 gene_id:390874|Hs108|chr19 ( 494) 1028 150.8 3.1e-36
>>CCDS10150.1 ONECUT1 gene_id:3175|Hs108|chr15 (465 aa)
initn: 3225 init1: 3225 opt: 3225 Z-score: 2362.2 bits: 446.4 E(32554): 3e-125
Smith-Waterman score: 3225; 100.0% identity (100.0% similar) in 465 aa overlap (1-465:1-465)
10 20 30 40 50 60
pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVAHRGSHLPPAHPRSMGMASLLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVAHRGSHLPPAHPRSMGMASLLD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GGSGGGDYHHHHRAPEHSLAGPLHPTMTMACETPPGMSMPTTYTTLTPLQPLPPISTVSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GGSGGGDYHHHHRAPEHSLAGPLHPTMTMACETPPGMSMPTTYTTLTPLQPLPPISTVSD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 KFPHHHHHHHHHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KFPHHHHHHHHHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 PLSSSGLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLTPTSAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PLSSSGLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLTPTSAG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 MVPINGLPPHHPHAHLNAQGHGQLLGTAREPNPSVTGAQVSNGSNSGQMEEINTKEVAQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MVPINGLPPHHPHAHLNAQGHGQLLGTAREPNPSVTGAQVSNGSNSGQMEEINTKEVAQR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 ITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 RMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQ
370 380 390 400 410 420
430 440 450 460
pF1KB9 QLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA
:::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA
430 440 450 460
>>CCDS42440.1 ONECUT2 gene_id:9480|Hs108|chr18 (504 aa)
initn: 1348 init1: 1017 opt: 1849 Z-score: 1361.0 bits: 261.3 E(32554): 1.7e-69
Smith-Waterman score: 1890; 63.4% identity (76.2% similar) in 513 aa overlap (1-465:20-504)
10 20 30
pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGG-----------
:: .::::..: ::: . . . ::
CCDS42 MKAAYTAYRCLTKDLEGCAMNPELTMESLGTLHGPAGGGSGGGGGGGGGGGGGGPGHEQE
10 20 30 40 50 60
40 50 60
pF1KB9 -----SPH--ARSSVAH-RGSHLPPAHPRSMG-----------------MASLLDGGSGG
::: .:.... :: ::. . .: :::.:: :
CCDS42 LLASPSPHHAGRGAAGSLRGPPPPPTAHQELGTAAAAAAAASRSAMVTSMASILD----G
70 80 90 100 110
70 80 90 100 110 120
pF1KB9 GDYHHHHRAPEHSLAGPLHPTMTMACET-PPGMSMPTTYTTLTPLQPLPPISTVSDKFPH
:::. :: :. ::: .:.:.:.. ::::.: .::::::::::::::::::::: :
CCDS42 GDYR-----PELSI--PLHHAMSMSCDSSPPGMGMSNTYTTLTPLQPLPPISTVSDKFHH
120 130 140 150 160
130 140 150 160 170 180
pF1KB9 HHHHHH-HHHHPHHHQRLAGNVSGSFTLMRDERGLASMNNLYTPYHKDVAGMGQSLSPLS
: ::: :::: ::::::.:::::::::::::::: .:::::.:: :.. ::.::::::.
CCDS42 PHPHHHPHHHHHHHHQRLSGNVSGSFTLMRDERGLPAMNNLYSPY-KEMPGMSQSLSPLA
170 180 190 200 210 220
190 200 210 220 230
pF1KB9 SS----GLGSIHNSQQGLPHYAHPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHL-----
.. :::..::.::.::.:. :: ::::.:: :.::: ::: : :::::
CCDS42 ATPLGNGLGGLHNAQQSLPNYGPPGH----DKMLSPN-FDAHHTAMLTR-GEQHLSRGLG
230 240 250 260 270 280
240 250 260 270 280 290
pF1KB9 TPTSAGMVPINGLPPHHPHAHLNAQGHGQLLGTARE-PNPSVTGAQVSNGSNSGQMEEIN
:: .: : .::: ::: .: .:.:: .:. .:: : : .:.::.. :::.::::
CCDS42 TPPAAMMSHLNGL--HHP-GH--TQSHGPVLAPSRERPPSSSSGSQVAT---SGQLEEIN
290 300 310 320 330
300 310 320 330 340 350
pF1KB9 TKEVAQRITTELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKW
:::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TKEVAQRITAELKRYSIPQAIFAQRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKW
340 350 360 370 380 390
360 370 380 390 400 410
pF1KB9 LQEPEFQRMSALRLAACKRKEQEHGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKE
::::::::::::::::::::::: .:::.:. :: ::::::.::::: ::::::::::::
CCDS42 LQEPEFQRMSALRLAACKRKEQEPNKDRNNSQKKSRLVFTDLQRRTLFAIFKENKRPSKE
400 410 420 430 440 450
420 430 440 450 460
pF1KB9 LQITISQQLGLELSTVSNFFMNARRRSLDKWQDEGSSNSGNSSSSSSTCTKA
.::::::::::::.::::::::::::::.::::. :. :.:::.:::::::
CCDS42 MQITISQQLGLELTTVSNFFMNARRRSLEKWQDDLST--GGSSSTSSTCTKA
460 470 480 490 500
>>CCDS45900.1 ONECUT3 gene_id:390874|Hs108|chr19 (494 aa)
initn: 1320 init1: 963 opt: 1028 Z-score: 764.0 bits: 150.8 E(32554): 3.1e-36
Smith-Waterman score: 1500; 54.3% identity (70.6% similar) in 506 aa overlap (4-465:2-494)
10 20 30 40 50
pF1KB9 MNAQLTMEAIGELHGVSHEPVPAPADLLGGSPHARSSVA-HRGSHLPPAHPRSM-GMASL
.:..:..: ::.:.: : : : . ::::..: ::: . :..: . :::::
CCDS45 MELSLESLGGLHSVAH----AQAGELLSPGHARSAAAQHRGL-VAPGRPGLVAGMASL
10 20 30 40 50
60 70 80 90 100
pF1KB9 LDGGSGGGDYHHHHRAPEHS----------LAGPLHPTMTMACETPPGMSMPTTYTTLTP
::::.::: . : :::::::.: ::::.: :.. :::::::
CCDS45 LDGGGGGGGGGAGGAGGAGSAGGGADFRGELAGPLHPAMGMACEAP-GLG--GTYTTLTP
60 70 80 90 100 110
110 120 130 140 150
pF1KB9 LQPLPPISTVSDKFPHHH---------HHHHHHHHPHHH---------QRLAGNVSGSFT
:: :::...:.::: :.: : : : ::: ::::..::::::
CCDS45 LQHLPPLAAVADKF-HQHAAAAAVAGAHGGHPHAHPHPAAAPPPPPPPQRLAASVSGSFT
120 130 140 150 160
160 170 180 190 200
pF1KB9 LMRDERG-LASMNNLYTPYHKDVAGMGQSLSPLSSSGLGSIHNSQQGLPH--------YA
::::::. :::...:: :: :.. .::. :::: .. ..:.. : : :.
CCDS45 LMRDERAALASVGHLYGPYGKELPAMGSPLSPLPNALPPALHGAPQPPPPPPPPPLAAYG
170 180 190 200 210 220
210 220 230 240 250
pF1KB9 HPGAAMPTDKMLTPNGFEAHHPAMLGRHGEQHLT---PTSAGMVPINGLPPHHPHAHLNA
:: . ::.: : .:: : :.::: .:. :. : ..: . .: . :
CCDS45 PPGH-LAGDKLLPPAAFEPH-AALLGR-AEDALARGLPGGGGGTGSGGAGSGSAAGLLAP
230 240 250 260 270 280
260 270 280 290 300 310
pF1KB9 QGHGQLLGTAREPNPSVTGAQVSNG--SNSGQMEEINTKEVAQRITTELKRYSIPQAIFA
: : . :. :. . : :.: : .. :::::::::::::.:::::::::::::
CCDS45 LG-GLAAAGAHGPHGGGGGPGGSGGGPSAGAAAEEINTKEVAQRITAELKRYSIPQAIFA
290 300 310 320 330 340
320 330 340 350 360 370
pF1KB9 QRVLCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEQE
::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QRILCRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEQE
350 360 370 380 390 400
380 390 400 410 420 430
pF1KB9 HGKDRGNTPKKPRLVFTDVQRRTLHAIFKENKRPSKELQITISQQLGLELSTVSNFFMNA
. :.:. ::: ::::::.::::: ::::::::::::.:.::::::::::.:::::::::
CCDS45 QQKERALQPKKQRLVFTDLQRRTLIAIFKENKRPSKEMQVTISQQLGLELNTVSNFFMNA
410 420 430 440 450 460
440 450 460
pF1KB9 RRRSLDKWQDEGSSNSGNSSSSSSTCTKA
::: ...: .: :. :. .....: .::
CCDS45 RRRCMNRWAEEPSTAPGGPAGATATFSKA
470 480 490
465 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:33:55 2016 done: Fri Nov 4 18:33:56 2016
Total Scan time: 2.920 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]