FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7942, 245 aa
1>>>pF1KB7942 245 - 245 aa - 245 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6982+/-0.000842; mu= 14.5596+/- 0.052
mean_var=125.8861+/-26.123, 0's: 0 Z-trim(110.6): 190 B-trim: 7 in 1/50
Lambda= 0.114310
statistics sampled from 11493 (11718) to 11493 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.72), E-opt: 0.2 (0.36), width: 16
Scan time: 2.450
The best scores are: opt bits E(32554)
CCDS1290.1 PRRX1 gene_id:5396|Hs108|chr1 ( 245) 1592 273.2 1.2e-73
CCDS1291.1 PRRX1 gene_id:5396|Hs108|chr1 ( 217) 1304 225.6 2.1e-59
CCDS6926.1 PRRX2 gene_id:51450|Hs108|chr9 ( 253) 877 155.3 3.7e-38
CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 ( 422) 356 69.6 3.8e-12
CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 ( 436) 356 69.6 3.9e-12
CCDS11972.1 RAX gene_id:30062|Hs108|chr18 ( 346) 353 69.0 4.7e-12
CCDS14215.1 ARX gene_id:170302|Hs108|chrX ( 562) 354 69.4 5.7e-12
CCDS2450.1 PAX3 gene_id:5077|Hs108|chr2 ( 403) 343 67.4 1.6e-11
CCDS2449.1 PAX3 gene_id:5077|Hs108|chr2 ( 407) 343 67.4 1.6e-11
CCDS3463.1 PHOX2B gene_id:8929|Hs108|chr4 ( 314) 341 67.0 1.7e-11
CCDS42826.1 PAX3 gene_id:5077|Hs108|chr2 ( 479) 343 67.5 1.8e-11
CCDS46522.1 PAX3 gene_id:5077|Hs108|chr2 ( 483) 343 67.5 1.8e-11
CCDS42825.1 PAX3 gene_id:5077|Hs108|chr2 ( 484) 343 67.5 1.8e-11
CCDS31468.1 ALX4 gene_id:60529|Hs108|chr11 ( 411) 342 67.3 1.8e-11
CCDS2448.1 PAX3 gene_id:5077|Hs108|chr2 ( 505) 343 67.5 1.9e-11
CCDS8214.1 PHOX2A gene_id:401|Hs108|chr11 ( 284) 336 66.1 2.9e-11
CCDS44388.2 DRGX gene_id:644168|Hs108|chr10 ( 263) 330 65.1 5.4e-11
>>CCDS1290.1 PRRX1 gene_id:5396|Hs108|chr1 (245 aa)
initn: 1592 init1: 1592 opt: 1592 Z-score: 1436.0 bits: 273.2 E(32554): 1.2e-73
Smith-Waterman score: 1592; 100.0% identity (100.0% similar) in 245 aa overlap (1-245:1-245)
10 20 30 40 50 60
pF1KB7 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 PRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQ
190 200 210 220 230 240
pF1KB7 VPTVN
:::::
CCDS12 VPTVN
>>CCDS1291.1 PRRX1 gene_id:5396|Hs108|chr1 (217 aa)
initn: 1304 init1: 1304 opt: 1304 Z-score: 1179.9 bits: 225.6 E(32554): 2.1e-59
Smith-Waterman score: 1304; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:1-199)
10 20 30 40 50 60
pF1KB7 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MTSSYGHVLERQPALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYPD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 PRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQ
:::::::::::::::::::
CCDS12 PRPAPRPTDYLSWGTASPYRSSSLPRCCLHEGLHNGF
190 200 210
>>CCDS6926.1 PRRX2 gene_id:51450|Hs108|chr9 (253 aa)
initn: 868 init1: 492 opt: 877 Z-score: 798.5 bits: 155.3 E(32554): 3.7e-38
Smith-Waterman score: 878; 62.7% identity (78.7% similar) in 249 aa overlap (12-245:12-253)
10 20 30 40 50
pF1KB7 MTSSYGHVLERQPALG-GRLDSPGNL---DTLQAKKNFSVSHLLDLEE---AGDMVA---
.:::: : : : : ::.::::::::::::: :: ..:
CCDS69 MDSAAAAFALDKPALGPGPPPPPPALGPGDCAQARKNFSVSHLLDLEEVAAAGRLAARPG
10 20 30 40 50 60
60 70 80 90 100
pF1KB7 AQADENVGEAGRSLLESPGLTSGSDTPQQDND----QLNSEEKKKRKQRRNRTTFNSSQL
:.:. : :.: : : .:::.. ::.. .: :.:.::::::::::::::
CCDS69 ARAEAREG-AAR---EPSGGSSGSEAAPQDGECPSPGRGSAAKRKKKQRRNRTTFNSSQL
70 80 90 100 110
110 120 130 140 150 160
pF1KB7 QALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLK
:::::::::::::::::::.:::::::.::::::::::::::::::::::::...:::::
CCDS69 QALERVFERTHYPDAFVREELARRVNLSEARVQVWFQNRRAKFRRNERAMLASRSASLLK
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB7 SYSGDVTAVEQPIVPRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQ-GINMANSIA
::: .. :.:::..:::. ::::: ..::::.. :: ....:: :.:::::::
CCDS69 SYSQEA-AIEQPVAPRPTALSPDYLSWTASSPYSTVPPYSP--GSSGPATPGVNMANSIA
180 190 200 210 220 230
230 240
pF1KB7 NLRLKAKEYSLQRNQVPTVN
.:::::::.::...::::::
CCDS69 SLRLKAKEFSLHHSQVPTVN
240 250
>>CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 (422 aa)
initn: 298 init1: 298 opt: 356 Z-score: 331.6 bits: 69.6 E(32554): 3.8e-12
Smith-Waterman score: 356; 38.2% identity (66.0% similar) in 191 aa overlap (66-245:181-365)
40 50 60 70 80 90
pF1KB7 VSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTSGS-DTPQQDNDQLNSEEKKKRKQ
:. : ...: .. .:.:. . . . :::
CCDS31 GQTGSWGTRPGWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKL
160 170 180 190 200 210
100 110 120 130 140 150
pF1KB7 RRNRTTFNSSQLQALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNER
.::::.:.. :..:::. ::::::::.:.:: :: ...: :::.::::.:::::.::.:.
CCDS31 QRNRTSFTQEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEK
220 230 240 250 260 270
160 170 180 190 200
pF1KB7 AMLANKNASLLKSY----SGDVTAVEQPIVPRPAPRPTDYLSWGTASPYSAMA---TYSA
..:: :. :. :.: ::: :.:. :.. .. :. . : ::::
CCDS31 LRNQRRQASNTPSHIPISSSFSTSVYQPI-PQPTT-PVSSFTSGSMLGRTDTALTNTYSA
280 290 300 310 320
210 220 230 240
pF1KB7 TCANNSPAQGINMANSIAN---LRLKAKEYSLQRNQVPTVN
: ...:::.. . ... :: . :.::
CCDS31 L----PPMPSFTMANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQ
330 340 350 360 370 380
CCDS31 PMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ
390 400 410 420
>>CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 (436 aa)
initn: 298 init1: 298 opt: 356 Z-score: 331.4 bits: 69.6 E(32554): 3.9e-12
Smith-Waterman score: 356; 38.2% identity (66.0% similar) in 191 aa overlap (66-245:195-379)
40 50 60 70 80 90
pF1KB7 VSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTSGS-DTPQQDNDQLNSEEKKKRKQ
:. : ...: .. .:.:. . . . :::
CCDS31 GQTGSWGTRPGWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKL
170 180 190 200 210 220
100 110 120 130 140 150
pF1KB7 RRNRTTFNSSQLQALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNER
.::::.:.. :..:::. ::::::::.:.:: :: ...: :::.::::.:::::.::.:.
CCDS31 QRNRTSFTQEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEK
230 240 250 260 270 280
160 170 180 190 200
pF1KB7 AMLANKNASLLKSY----SGDVTAVEQPIVPRPAPRPTDYLSWGTASPYSAMA---TYSA
..:: :. :. :.: ::: :.:. :.. .. :. . : ::::
CCDS31 LRNQRRQASNTPSHIPISSSFSTSVYQPI-PQPTT-PVSSFTSGSMLGRTDTALTNTYSA
290 300 310 320 330 340
210 220 230 240
pF1KB7 TCANNSPAQGINMANSIAN---LRLKAKEYSLQRNQVPTVN
: ...:::.. . ... :: . :.::
CCDS31 L----PPMPSFTMANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQ
350 360 370 380 390
CCDS31 PMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ
400 410 420 430
>>CCDS11972.1 RAX gene_id:30062|Hs108|chr18 (346 aa)
initn: 440 init1: 319 opt: 353 Z-score: 329.9 bits: 69.0 E(32554): 4.7e-12
Smith-Waterman score: 356; 40.7% identity (66.7% similar) in 162 aa overlap (67-218:112-270)
40 50 60 70 80 90
pF1KB7 SHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRR
:::: : : . .:. ::. :.:.::
CCDS11 EPSPPPAPAPAPEYEAPRPYCPKEPGEARPSPGLPVG---PATGEAKLSEEEQPKKKHRR
90 100 110 120 130
100 110 120 130 140 150
pF1KB7 NRTTFNSSQLQALERVFERTHYPDAFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAM
:::::.. ::. :::.::..::::.. ::.:: .::: :.::::::::::::.::.:.
CCDS11 NRTTFTTYQLHELERAFEKSHYPDVYSREELAGKVNLPEVRVQVWFQNRRAKWRRQEKLE
140 150 160 170 180 190
160 170 180 190 200
pF1KB7 LAN---KNASLLKSYSGDVTAVEQPIV--PR----PAPRPTDYLSW-GTASPYSAMATYS
... ... ::. . .:. .:. : :: :: : : .. .. .
CCDS11 VSSMKLQDSPLLSFSRSPPSATLSPLGAGPGSGGGPAGGALPLESWLGPPLPGGGATALQ
200 210 220 230 240 250
210 220 230 240
pF1KB7 ATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPTVN
. . . :::..
CCDS11 SLPGFGPPAQSLPASYTPPPPPPPFLNSPPLGPGLQPLAPPPPSYPCGPGFGDKFPLDEA
260 270 280 290 300 310
>>CCDS14215.1 ARX gene_id:170302|Hs108|chrX (562 aa)
initn: 376 init1: 323 opt: 354 Z-score: 328.3 bits: 69.4 E(32554): 5.7e-12
Smith-Waterman score: 354; 40.3% identity (62.2% similar) in 196 aa overlap (46-229:272-462)
20 30 40 50 60 70
pF1KB7 GGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEAGR-----SLLESPGL
: ..:: : . :.:. :: :
CCDS14 ELLEDDEEELLEDDARALLKEPRRCPVAATGAVAAAAAAAVATEGGELSPKEELLLHPED
250 260 270 280 290 300
80 90 100 110 120
pF1KB7 TSGSDTPQQDNDQL----NSEEKK-KRKQRRNRTTFNSSQLQALERVFERTHYPDAFVRE
. :.: .:. : .::: :::::: ::::.: ::. :::.:..:::::.:.::
CCDS14 AEGKDG--EDSVCLSAGSDSEEGLLKRKQRRYRTTFTSYQLEELERAFQKTHYPDVFTRE
310 320 330 340 350
130 140 150 160 170 180
pF1KB7 DLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIVPR--P
.:: :..::::::::::::::::.:. :.: .. .: . : ..:. .:. :
CCDS14 ELAMRLDLTEARVQVWFQNRRAKWRKREKAGAQTHPPGL--PFPGPLSAT-HPLSPYLDA
360 370 380 390 400 410
190 200 210 220 230 240
pF1KB7 APRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPT
.: : . . .: .: :. .: . : . .. : : : :
CCDS14 SPFPPHHPALDSAWTAAAAAAAAAFPSLPPPPGSASLPPSGAPLGLSTFLGAAVFRHPAF
420 430 440 450 460 470
pF1KB7 VN
CCDS14 ISPAFGRLFSTMAPLTSASTAAALLRQPTPAVEGAVASGALADPATAAADRRASSIAALR
480 490 500 510 520 530
>>CCDS2450.1 PAX3 gene_id:5077|Hs108|chr2 (403 aa)
initn: 304 init1: 304 opt: 343 Z-score: 320.2 bits: 67.4 E(32554): 1.6e-11
Smith-Waterman score: 343; 39.4% identity (67.4% similar) in 175 aa overlap (43-214:167-333)
20 30 40 50 60 70
pF1KB7 PALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTS
:: .:. .:.:. .: .:. . :.
CCDS24 LLKDAVCDRNTVPSVSSISRILRSKFGKGEEEEADLERKEAEESEKKAKHSI--DGILSE
140 150 160 170 180 190
80 90 100 110 120
pF1KB7 GSDTPQQDN-DQLNSEEKK--KRKQRRNRTTFNSSQLQALERVFERTHYPDAFVREDLAR
...::.:. ....:: ::::::.::::.. ::. :::.:::::::: ..::.::.
CCDS24 RASAPQSDEGSDIDSEPDLPLKRKQRRSRTTFTAEQLEELERAFERTHYPDIYTREELAQ
200 210 220 230 240 250
130 140 150 160 170 180
pF1KB7 RVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIVPRPAPRPTD
:..::::::::::.::::..:.. ::. .. . : . .: .: :.
CCDS24 RAKLTEARVQVWFSNRRARWRKQAG---ANQLMAFNHLIPGGFPPTAMPTLPTYQLSETS
260 270 280 290 300 310
190 200 210 220 230 240
pF1KB7 YLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPTVN
: :. : .:.. :.: .:
CCDS24 YQP--TSIP-QAVSDPSSTVHRPQPLPPSTVHQSTIPSNPDSSSAYCLPSTRHGFSSYTD
320 330 340 350 360
>>CCDS2449.1 PAX3 gene_id:5077|Hs108|chr2 (407 aa)
initn: 304 init1: 304 opt: 343 Z-score: 320.2 bits: 67.4 E(32554): 1.6e-11
Smith-Waterman score: 343; 39.4% identity (67.4% similar) in 175 aa overlap (43-214:167-333)
20 30 40 50 60 70
pF1KB7 PALGGRLDSPGNLDTLQAKKNFSVSHLLDLEEAGDMVAAQADENVGEAGRSLLESPGLTS
:: .:. .:.:. .: .:. . :.
CCDS24 LLKDAVCDRNTVPSVSSISRILRSKFGKGEEEEADLERKEAEESEKKAKHSI--DGILSE
140 150 160 170 180 190
80 90 100 110 120
pF1KB7 GSDTPQQDN-DQLNSEEKK--KRKQRRNRTTFNSSQLQALERVFERTHYPDAFVREDLAR
...::.:. ....:: ::::::.::::.. ::. :::.:::::::: ..::.::.
CCDS24 RASAPQSDEGSDIDSEPDLPLKRKQRRSRTTFTAEQLEELERAFERTHYPDIYTREELAQ
200 210 220 230 240 250
130 140 150 160 170 180
pF1KB7 RVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPIVPRPAPRPTD
:..::::::::::.::::..:.. ::. .. . : . .: .: :.
CCDS24 RAKLTEARVQVWFSNRRARWRKQAG---ANQLMAFNHLIPGGFPPTAMPTLPTYQLSETS
260 270 280 290 300 310
190 200 210 220 230 240
pF1KB7 YLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRNQVPTVN
: :. : .:.. :.: .:
CCDS24 YQP--TSIP-QAVSDPSSTVHRPQPLPPSTVHQSTIPSNPDSSSAYCLPSTRHGFSSYTD
320 330 340 350 360
>>CCDS3463.1 PHOX2B gene_id:8929|Hs108|chr4 (314 aa)
initn: 334 init1: 334 opt: 341 Z-score: 319.7 bits: 67.0 E(32554): 1.7e-11
Smith-Waterman score: 341; 48.4% identity (68.0% similar) in 128 aa overlap (90-217:94-216)
60 70 80 90 100 110
pF1KB7 AGRSLLESPGLTSGSDTPQQDNDQLNSEEKKKRKQRRNRTTFNSSQLQALERVFERTHYP
.:::::: ::::.:.::. ::::: .::::
CCDS34 SCSLGTLRDHQSSPYAAVPYKLFTDHGGLNEKRKQRRIRTTFTSAQLKELERVFAETHYP
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 DAFVREDLARRVNLTEARVQVWFQNRRAKFRRNERAMLANKNASLLKSYSGDVTAVEQPI
: ..::.:: ...::::::::::::::::::..::: : :. : :: . .
CCDS34 DIYTREELALKIDLTEARVQVWFQNRRAKFRKQERAAAAAAAAAKNGS-SGKKSDSSRDD
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB7 VPRPAPRPTDYLSWGTASPYSAMATYSATCANNSPAQGINMANSIANLRLKAKEYSLQRN
. : . :: : : .: . . .:. :. . :
CCDS34 ESKEA-KSTDPDSTGGPGP---NPNPTPSCGANGGGGGGPSPAGAPGAAGPGGPGGEPGK
190 200 210 220 230
240
pF1KB7 QVPTVN
CCDS34 GGAAAAAAAAAAAAAAAAAAAAGGLAAAGGPGQGWAPGPGPITSIPDSLGGPFASVLSSL
240 250 260 270 280 290
245 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 10:14:02 2016 done: Sat Nov 5 10:14:02 2016
Total Scan time: 2.450 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]