FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7668, 402 aa
1>>>pF1KB7668 402 - 402 aa - 402 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.6325+/-0.00105; mu= 0.4627+/- 0.064
mean_var=344.4001+/-71.518, 0's: 0 Z-trim(115.1): 140 B-trim: 550 in 1/50
Lambda= 0.069110
statistics sampled from 15529 (15676) to 15529 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.8), E-opt: 0.2 (0.482), width: 16
Scan time: 3.520
The best scores are: opt bits E(32554)
CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 ( 402) 2808 293.4 2.6e-79
CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 ( 406) 2122 225.0 1e-58
CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 ( 390) 608 74.0 2.7e-13
CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 ( 397) 556 68.8 1e-11
CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 ( 402) 556 68.8 1e-11
>>CCDS9171.1 LHX5 gene_id:64211|Hs108|chr12 (402 aa)
initn: 2808 init1: 2808 opt: 2808 Z-score: 1537.4 bits: 293.4 E(32554): 2.6e-79
Smith-Waterman score: 2808; 100.0% identity (100.0% similar) in 402 aa overlap (1-402:1-402)
10 20 30 40 50 60
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 SSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 SSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTKR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 RGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMKQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 LSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 LSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHGP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 PSQAQSPADSSFLAASGPGSTPLGALEPPLAGPHAADNPRFTDMISHPDTPSPEPGLPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS91 PSQAQSPADSSFLAASGPGSTPLGALEPPLAGPHAADNPRFTDMISHPDTPSPEPGLPGT
310 320 330 340 350 360
370 380 390 400
pF1KB7 LHPMPGEVFSGGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
::::::::::::::::::::::::::::::::::::::::::
CCDS91 LHPMPGEVFSGGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
370 380 390 400
>>CCDS11316.1 LHX1 gene_id:3975|Hs108|chr17 (406 aa)
initn: 1209 init1: 916 opt: 2122 Z-score: 1167.7 bits: 225.0 E(32554): 1e-58
Smith-Waterman score: 2122; 74.6% identity (90.0% similar) in 409 aa overlap (2-402:1-406)
10 20 30 40 50 60
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCECKTNLSEKCFSREGKLYCKNDFFRRF
:::::::.:::::::::::::::::.::::::::: ::.:::::::::::::::::: :
CCDS11 MVHCAGCKRPILDRFLLNVLDRAWHVKCVQCCECKCNLTEKCFSREGKLYCKNDFFRCF
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 GTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVCNKQLSTGEELYVIDENKFVCKDDYL
::::::::::::::::::.::::::::::::::.::::::::::::.:::::::::.:::
CCDS11 GTKCAGCAQGISPSDLVRRARSKVFHLNCFTCMMCNKQLSTGEELYIIDENKFVCKEDYL
60 70 80 90 100 110
130 140 150 160 170
pF1KB7 SSSSL-KEGSLNSVSSCTDRSLSPDLQDALQDDPKETDNSTSSDKETANNENEEQNSGTK
:.::. ::.::.:... .: ::::: :: ::: :...... ::::...:::..:: :.:
CCDS11 SNSSVAKENSLHSATTGSDPSLSPDSQDPSQDDAKDSESANVSDKEAGSNENDDQNLGAK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB7 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQETGLNMRVIQVWFQNRRSKERRMK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB7 QLSALGARRHAFFRSPRRMRPLGGRLDESEMLGSTPYTYYGDYQGDYYAPGSNYDFFAHG
:::::::::::::::::::::: ::. .:.. . :...:::::..::.::.::::: .:
CCDS11 QLSALGARRHAFFRSPRRMRPLVDRLEPGELIPNGPFSFYGDYQSEYYGPGGNYDFFPQG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB7 PPS-QAQSPADSSFLAASGPGSTPLGALEPPLAGPH-AADNPRFTDMISHP--DTPSPEP
::: :::.:.: :. .:::..::::.:: :: : : ... ::::...:: :.:::::
CCDS11 PPSSQAQTPVDLPFVPSSGPSGTPLGGLEHPLPGHHPSSEAQRFTDILAHPPGDSPSPEP
300 310 320 330 340 350
360 370 380 390 400
pF1KB7 GLPGTLHPMPGEVFSGGPSPPFP---MSGTSGYSGPLSHPNPELNEAAVW
.::: :: : .::: :::::: ..: ..:.. :::: ::.::::::
CCDS11 SLPGPLHSMSAEVF--GPSPPFSSLSVNGGASYGNHLSHP-PEMNEAAVW
360 370 380 390 400
>>CCDS1338.1 LHX4 gene_id:89884|Hs108|chr1 (390 aa)
initn: 891 init1: 565 opt: 608 Z-score: 352.1 bits: 74.0 E(32554): 2.7e-13
Smith-Waterman score: 836; 37.1% identity (61.0% similar) in 420 aa overlap (4-398:29-384)
10 20 30
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCEC
.::::.. :::.:.:.:::: :: .:..: .:
CCDS13 MMQSATVPAEGAVKGLPEMLGVPMQQIPQCAGCNQHILDKFILKVLDRHWHSSCLKCADC
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB7 KTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMVC
. .:...:::: :..:::.:::.::::::..: ::: :...::::.. :.::.::.:..:
CCDS13 QMQLADRCFSRAGSVYCKEDFFKRFGTKCTACQQGIPPTQVVRKAQDFVYHLHCFACIIC
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB7 NKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPKE
:.::.::.:.:.......:::.::
CCDS13 NRQLATGDEFYLMEDGRLVCKEDY------------------------------------
130 140
160 170 180 190 200 210
pF1KB7 TDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLAQ
:::. .:.....:.:: ::::: :::::::: :. .:::.::.::::..
CCDS13 ---------ETAK-QNDDSEAGAKR--PRTTITAKQLETLKNAYKNSPKPARHVREQLSS
150 160 170 180 190
220 230 240 250 260
pF1KB7 ETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGR----------L
::::.:::.::::::::.::.:.:. .: : :..: .: : . . .
CCDS13 ETGLDMRVVQVWFQNRRAKEKRLKK-DAGRHRWGQFYKSVKRSRGSSKQEKESSAEDCGV
200 210 220 230 240 250
270 280 290 300 310
pF1KB7 DESEM----------LGSTPYTY--YGDYQGDYYAPGSNYDFFAHGPPSQAQSPADSS-F
..::. :: : : :: : :: : : .. :. :.: .
CCDS13 SDSELSFREDQILSELGHTNRIYGNVGDVTGGQLMNGS---FSMDGTGQSYQDLRDGSPY
260 270 280 290 300
320 330 340 350 360 370
pF1KB7 LAASGPGS-TPLGALEPPLAG-PHAADNPRFTDMISHPDTPSPEPGLPGTLHPMPGEVFS
..:.: . : . : : : ...:. .:.: :. ::. : .
CCDS13 GIPQSPSSISSLPSHAPLLNGLDYTVDSN--LGIIAHAG-----QGVSQTLRAM-----A
310 320 330 340 350
380 390 400
pF1KB7 GGPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
:::. . ... :: . :. :.:
CCDS13 GGPTSDISTGSSVGYPDFPTSPGSWLDEMDHPPF
360 370 380 390
>>CCDS6994.1 LHX3 gene_id:8022|Hs108|chr9 (397 aa)
initn: 934 init1: 549 opt: 556 Z-score: 324.0 bits: 68.8 E(32554): 1e-11
Smith-Waterman score: 862; 38.7% identity (61.3% similar) in 419 aa overlap (5-398:31-391)
10 20 30
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCE
::::.. :::::.:..::: :: ::..: .
CCDS69 MLLETGLERDRARPGAAAVCTLGGTREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB7 CKTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMV
:.: :.:.:::: ..:::.:::.:::::::.: :: :...::.:.. :.::.::.:.:
CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB7 CNKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPK
:..::.::.:.:.......::: ::
CCDS69 CKRQLATGDEFYLMEDSRLVCKADY-----------------------------------
130 140
160 170 180 190 200 210
pF1KB7 ETDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA
:::.... : .: .: ::::: ::::::::.:. ..:::.::.::::.
CCDS69 ----------ETAKQREAE---ATAKR-PRTTITAKQLETLKSAYNTSPKPARHVREQLS
150 160 170 180 190
220 230 240 250 260 270
pF1KB7 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGRLDES---EML
.::::.:::.::::::::.::.:.:. .: : .::. .: : :.. :.. :
CCDS69 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRG-GSKSDKDSVQEGQ
200 210 220 230 240
280 290 300 310
pF1KB7 GSTPYTYYGDYQGDYYAPGSNYDFFAHGPPSQA---QSPADSSFLAASG-----------
: . . : . .: . . : :.:: : : ..: :
CCDS69 DSDAEVSFPDEPSLAEMGPANGLYGSLGEPTQALGRPSGALGNFSLEHGGLAGPEQYREL
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB7 -PGSTPLGALEPPLAGPHAADNPR-FTDMISHPDT-----PSPEPGLPGTLHPMPGEVFS
::: : : . : :.:.. .:. . . . .::: :: :: : : : .:..
CCDS69 RPGS-PYG-VPPSPAAPQSLPGPQPLLSSLVYPDTSLGLVPSGAPGGP----P-PMRVLA
310 320 330 340 350 360
380 390 400
pF1KB7 G-GPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
: ::: . ....:: . : :.:
CCDS69 GNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF
370 380 390
>>CCDS6995.1 LHX3 gene_id:8022|Hs108|chr9 (402 aa)
initn: 934 init1: 549 opt: 556 Z-score: 323.9 bits: 68.8 E(32554): 1e-11
Smith-Waterman score: 862; 38.7% identity (61.3% similar) in 419 aa overlap (5-398:36-396)
10 20 30
pF1KB7 MMVHCAGCERPILDRFLLNVLDRAWHIKCVQCCE
::::.. :::::.:..::: :: ::..: .
CCDS69 ELGPARESAGGDLLLALLARRADLRREIPLCAGCDQHILDRFILKALDRHWHSKCLKCSD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB7 CKTNLSEKCFSREGKLYCKNDFFRRFGTKCAGCAQGISPSDLVRKARSKVFHLNCFTCMV
:.: :.:.:::: ..:::.:::.:::::::.: :: :...::.:.. :.::.::.:.:
CCDS69 CHTPLAERCFSRGESVYCKDDFFKRFGTKCAACQLGIPPTQVVRRAQDFVYHLHCFACVV
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB7 CNKQLSTGEELYVIDENKFVCKDDYLSSSSLKEGSLNSVSSCTDRSLSPDLQDALQDDPK
:..::.::.:.:.......::: ::
CCDS69 CKRQLATGDEFYLMEDSRLVCKADY-----------------------------------
130 140 150
160 170 180 190 200 210
pF1KB7 ETDNSTSSDKETANNENEEQNSGTKRRGPRTTIKAKQLETLKAAFAATPKPTRHIREQLA
:::.... : .: .: ::::: ::::::::.:. ..:::.::.::::.
CCDS69 ----------ETAKQREAE---ATAKR-PRTTITAKQLETLKSAYNTSPKPARHVREQLS
160 170 180 190
220 230 240 250 260 270
pF1KB7 QETGLNMRVIQVWFQNRRSKERRMKQLSALGARRHAFFRSPRRMRPLGGRLDES---EML
.::::.:::.::::::::.::.:.:. .: : .::. .: : :.. :.. :
CCDS69 SETGLDMRVVQVWFQNRRAKEKRLKK-DAGRQRWGQYFRNMKRSRG-GSKSDKDSVQEGQ
200 210 220 230 240 250
280 290 300 310
pF1KB7 GSTPYTYYGDYQGDYYAPGSNYDFFAHGPPSQA---QSPADSSFLAASG-----------
: . . : . .: . . : :.:: : : ..: :
CCDS69 DSDAEVSFPDEPSLAEMGPANGLYGSLGEPTQALGRPSGALGNFSLEHGGLAGPEQYREL
260 270 280 290 300 310
320 330 340 350 360 370
pF1KB7 -PGSTPLGALEPPLAGPHAADNPR-FTDMISHPDT-----PSPEPGLPGTLHPMPGEVFS
::: : : . : :.:.. .:. . . . .::: :: :: : : : .:..
CCDS69 RPGS-PYG-VPPSPAAPQSLPGPQPLLSSLVYPDTSLGLVPSGAPGGP----P-PMRVLA
320 330 340 350 360
380 390 400
pF1KB7 G-GPSPPFPMSGTSGYSGPLSHPNPELNEAAVW
: ::: . ....:: . : :.:
CCDS69 GNGPSSDLSTGSSGGYPDFPASPASWLDEVDHAQF
370 380 390 400
402 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 04:05:34 2016 done: Sat Nov 5 04:05:35 2016
Total Scan time: 3.520 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]