FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7983, 422 aa
1>>>pF1KB7983 422 - 422 aa - 422 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.8105+/-0.00092; mu= 2.4064+/- 0.056
mean_var=219.8653+/-45.453, 0's: 0 Z-trim(113.0): 186 B-trim: 0 in 0/52
Lambda= 0.086496
statistics sampled from 13522 (13726) to 13522 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.762), E-opt: 0.2 (0.422), width: 16
Scan time: 3.410
The best scores are: opt bits E(32554)
CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 ( 422) 2864 370.0 2.5e-102
CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 ( 436) 2546 330.3 2.2e-90
CCDS46398.1 PAX8 gene_id:7849|Hs108|chr2 ( 450) 791 111.3 1.9e-24
CCDS41561.1 PAX2 gene_id:5076|Hs108|chr10 ( 394) 786 110.6 2.7e-24
CCDS7499.1 PAX2 gene_id:5076|Hs108|chr10 ( 396) 786 110.6 2.7e-24
CCDS42735.1 PAX8 gene_id:7849|Hs108|chr2 ( 287) 758 107.0 2.4e-23
CCDS65047.1 PAX5 gene_id:5079|Hs108|chr9 ( 357) 759 107.2 2.6e-23
CCDS42736.1 PAX8 gene_id:7849|Hs108|chr2 ( 321) 758 107.1 2.6e-23
CCDS46399.1 PAX8 gene_id:7849|Hs108|chr2 ( 398) 758 107.1 3.1e-23
CCDS65044.1 PAX5 gene_id:5079|Hs108|chr9 ( 295) 755 106.7 3.1e-23
CCDS65045.1 PAX5 gene_id:5079|Hs108|chr9 ( 324) 755 106.7 3.4e-23
CCDS65046.1 PAX5 gene_id:5079|Hs108|chr9 ( 328) 755 106.7 3.4e-23
CCDS65048.1 PAX5 gene_id:5079|Hs108|chr9 ( 362) 755 106.7 3.7e-23
CCDS6607.1 PAX5 gene_id:5079|Hs108|chr9 ( 391) 755 106.8 3.9e-23
CCDS65042.1 PAX5 gene_id:5079|Hs108|chr9 ( 319) 683 97.7 1.7e-20
CCDS65043.1 PAX5 gene_id:5079|Hs108|chr9 ( 348) 683 97.7 1.8e-20
CCDS5797.1 PAX4 gene_id:5078|Hs108|chr7 ( 343) 630 91.1 1.8e-18
CCDS46522.1 PAX3 gene_id:5077|Hs108|chr2 ( 483) 624 90.5 3.8e-18
CCDS44075.1 PAX7 gene_id:5081|Hs108|chr1 ( 518) 619 89.9 6.2e-18
CCDS44074.1 PAX7 gene_id:5081|Hs108|chr1 ( 505) 614 89.3 9.4e-18
CCDS186.1 PAX7 gene_id:5081|Hs108|chr1 ( 520) 614 89.3 9.6e-18
CCDS42826.1 PAX3 gene_id:5077|Hs108|chr2 ( 479) 607 88.4 1.7e-17
CCDS9662.1 PAX9 gene_id:5083|Hs108|chr14 ( 341) 604 87.9 1.7e-17
CCDS42825.1 PAX3 gene_id:5077|Hs108|chr2 ( 484) 607 88.4 1.7e-17
CCDS2448.1 PAX3 gene_id:5077|Hs108|chr2 ( 505) 607 88.4 1.7e-17
CCDS74709.1 PAX1 gene_id:5075|Hs108|chr20 ( 457) 605 88.1 1.9e-17
CCDS13146.2 PAX1 gene_id:5075|Hs108|chr20 ( 534) 605 88.2 2.1e-17
CCDS2451.1 PAX3 gene_id:5077|Hs108|chr2 ( 206) 579 84.6 9.8e-17
CCDS46523.1 PAX3 gene_id:5077|Hs108|chr2 ( 215) 579 84.6 1e-16
CCDS2450.1 PAX3 gene_id:5077|Hs108|chr2 ( 403) 583 85.3 1.2e-16
CCDS2449.1 PAX3 gene_id:5077|Hs108|chr2 ( 407) 583 85.3 1.2e-16
>>CCDS31451.1 PAX6 gene_id:5080|Hs108|chr11 (422 aa)
initn: 2864 init1: 2864 opt: 2864 Z-score: 1950.7 bits: 370.0 E(32554): 2.5e-102
Smith-Waterman score: 2864; 100.0% identity (100.0% similar) in 422 aa overlap (1-422:1-422)
10 20 30 40 50 60
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSKILGRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSKILGRY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTNDNIPSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 YETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTNDNIPSV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 SSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGTSVPGQPTQDGCQQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGTSVPGQPTQDGCQQQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 EGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALEKEFERTHYPDVFAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALEKEFERTHYPDVFAR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 ERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISSSFSTSVYQPIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISSSFSTSVYQPIP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 QPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPPVPSQTSSYSCMLPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPPVPSQTSSYSCMLPT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 SPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPR
370 380 390 400 410 420
pF1KB7 LQ
::
CCDS31 LQ
>>CCDS31452.1 PAX6 gene_id:5080|Hs108|chr11 (436 aa)
initn: 2546 init1: 2546 opt: 2546 Z-score: 1736.0 bits: 330.3 E(32554): 2.2e-90
Smith-Waterman score: 2826; 96.8% identity (96.8% similar) in 436 aa overlap (1-422:1-436)
10 20 30 40
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQ-------------
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQTHADAKVQVLDNQ
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 -VSNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NVSNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 LSEGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LSEGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQTGSWGTRPGWYPGT
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB7 SVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSFTQEQIEALE
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 KEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIP
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB7 ISSSFSTSVYQPIPQPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 ISSSFSTSVYQPIPQPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPP
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB7 VPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLISPGVSVPVQ
370 380 390 400 410 420
410 420
pF1KB7 VPGSEPDMSQYWPRLQ
::::::::::::::::
CCDS31 VPGSEPDMSQYWPRLQ
430
>>CCDS46398.1 PAX8 gene_id:7849|Hs108|chr2 (450 aa)
initn: 730 init1: 652 opt: 791 Z-score: 552.3 bits: 111.3 E(32554): 1.9e-24
Smith-Waterman score: 791; 36.1% identity (62.3% similar) in 438 aa overlap (1-418:6-417)
10 20 30 40 50
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK
....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.:::::
CCDS46 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND
::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: ::
CCDS46 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP-
..::::::::..:. ... .. :. . :.: : .. : : .. :.
CCDS46 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY
130 140 150 160 170 180
180 190 200 210 220
pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF
. .: : . ..... .:: . .. : . . :. :: .:.:...: :: :
CCDS46 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS
:: :::...: .. .. . . : : . . :. :::. :..
CCDS46 ERQHYPEAYASP---SHTKGEQGLYPLPLLNST--------LDDGK--ATLTPSNTPLGR
250 260 270 280
290 300 310 320 330
pF1KB7 SFST-SVYQPIPQPTTPV-----------SSFTSGSMLGRTDTALTNTYSALPPMPSFTM
..:: ..: . .: .: :: : .:. . . : .. :..::. .:
CCDS46 NLSTHQTYPVVADPHSPFAIKQETPEVSSSSSTPSSLSSSAFLDLQQVGSGVPPFNAFPH
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB7 ANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTTSTGLI
: .. : . :. . :: :. :::. : . .:. .... . .
CCDS46 AASVYGQFTGQALLSGREMVGPTLPGY---------PPHIPT----SGQGSYASSAIAGM
350 360 370 380 390
400 410 420
pF1KB7 SPGVSVPVQVPGSEP--DMSQYWPRLQ
: .. : : ..:. :
CCDS46 VAGSEYSGNAYGHTPYSSYSEAWRFPNSSLLSSPYYYSSTSRPSAPPTTATAFDHL
400 410 420 430 440 450
>>CCDS41561.1 PAX2 gene_id:5076|Hs108|chr10 (394 aa)
initn: 799 init1: 704 opt: 786 Z-score: 549.7 bits: 110.6 E(32554): 2.7e-24
Smith-Waterman score: 798; 39.1% identity (64.6% similar) in 396 aa overlap (1-372:13-394)
10 20 30 40
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV
:. .:.::::::::::::::::: .::.::::::.:.::::::: :.:
CCDS41 MDMHCKADPFSAMHPGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS
:.::::::::::::::::.: .::::::.::::.::.:::.:::. :..::::::::::.
CCDS41 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVDKIAEYKRQNPTMFAWEIRDRLLA
70 80 90 100 110 120
110 120 130 140 150
pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT----------GSWGT
::.: ::..::::::::..:. ... . :: . :.: .: ..
CCDS41 EGICDNDTVPSVSSINRIIRTKVQQPFHPTPDGAGTGVTA-PGHTIVPSTASPPVSSASN
130 140 150 160 170
160 170 180 190 200 210
pF1KB7 RP-GWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSF
: : : ... : : ..: .... . .:. .. .: ..: .:. .:
CCDS41 DPVGSYSINGILGIPRSNGEKRKRDEDVSEGSVPNGDSQSGVDSLRKHLRAD------TF
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB7 TQEQIEALEKEFERTHYPDVF-ARERLAAK----IDLPEARIQVWFSNRRAKWRREEKLR
::.:.:::.. ::: ::::: : :.. .. .:: . . . . .:
CCDS41 TQQQLEALDRVFERPSYPDVFQASEHIKSEQGNEYSLPALTPGLDEVKSSLSASTNPELG
240 250 260 270 280 290
280 290 300 310 320
pF1KB7 NQRRQASNTPSHIPISSSFSTSVYQPIPQPTTPVS---SFTSGSMLGRTDTALTNTYSAL
. ..:.: .. ... .:. : : .: . :. .... : . . .:.
CCDS41 S---NVSGTQTYPVVTGRDMASTTLPGYPPHVPPTGQGSYPTSTLAGMVP---GSEFSGN
300 310 320 330 340
330 340 350 360 370 380
pF1KB7 P-PMPSFTMANNLPMQPPVPSQTSS--YSCMLP--TSPSVNGRSYDTYTPPHMQTHMNSQ
: :..: : : . :. :: : : ..:.. . .:: .
CCDS41 PYSHPQYT-AYNEAWRFSNPALLSSPYYYSAAPRGSAPAAAAAAYDRH
350 360 370 380 390
390 400 410 420
pF1KB7 PMGTSGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ
>>CCDS7499.1 PAX2 gene_id:5076|Hs108|chr10 (396 aa)
initn: 799 init1: 704 opt: 786 Z-score: 549.7 bits: 110.6 E(32554): 2.7e-24
Smith-Waterman score: 839; 39.9% identity (66.9% similar) in 396 aa overlap (1-376:13-396)
10 20 30 40
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV
:. .:.::::::::::::::::: .::.::::::.:.::::::: :.:
CCDS74 MDMHCKADPFSAMHPGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS
:.::::::::::::::::.: .::::::.::::.::.:::.:::. :..::::::::::.
CCDS74 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVDKIAEYKRQNPTMFAWEIRDRLLA
70 80 90 100 110 120
110 120 130 140 150
pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT----------GSWGT
::.: ::..::::::::..:. ... . :: . :.: .: ..
CCDS74 EGICDNDTVPSVSSINRIIRTKVQQPFHPTPDGAGTGVTA-PGHTIVPSTASPPVSSASN
130 140 150 160 170
160 170 180 190 200 210
pF1KB7 RP-GWYPGTSVPGQPTQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRNRTSF
: : : ... : : ..: .... . .:. ::.... .. .:...:. . .:
CCDS74 DPVGSYSINGILGIPRSNGEKRKRDEDVSEGSVP-NGDSQSGVD---SLRKHLRAD--TF
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB7 TQEQIEALEKEFERTHYPDVF-ARERLAAK----IDLPEARIQVWFSNRRAKWRREEKLR
::.:.:::.. ::: ::::: : :.. .. .:: . . . . .:
CCDS74 TQQQLEALDRVFERPSYPDVFQASEHIKSEQGNEYSLPALTPGLDEVKSSLSASTNPELG
240 250 260 270 280 290
280 290 300 310 320
pF1KB7 NQRRQASNTPSHIPISSSFSTSVYQPIPQPTTPVS---SFTSGSMLGRTDTALTNTYSAL
. ..:.: .. ... .:. : : .: . :. .... : . : .. :.:
CCDS74 S---NVSGTQTYPVVTGRDMASTTLPGYPPHVPPTGQGSYPTSTLAGMVPEAAVGPSSSL
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB7 PPMPSFTMANNLP-MQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGT
:. .:. : .:: :. .. . : :.. : :. :::.
CCDS74 MSKPGRKLAEVPPCVQPTGASSPATRTATPSTRPTT--RLGDSATPPY
360 370 380 390
390 400 410 420
pF1KB7 SGTTSTGLISPGVSVPVQVPGSEPDMSQYWPRLQ
>>CCDS42735.1 PAX8 gene_id:7849|Hs108|chr2 (287 aa)
initn: 737 init1: 652 opt: 758 Z-score: 532.7 bits: 107.0 E(32554): 2.4e-23
Smith-Waterman score: 758; 49.4% identity (75.9% similar) in 245 aa overlap (1-239:6-250)
10 20 30 40 50
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK
....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.:::::
CCDS42 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND
::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: ::
CCDS42 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP-
..::::::::..:. ... .. :. . :.: : .. : : .. :.
CCDS42 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY
130 140 150 160 170 180
180 190 200 210 220
pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF
. .: : . ..... .:: . .. : . . :. :: .:.:...: :: :
CCDS42 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS
:: :::...:
CCDS42 ERQHYPEAYASPSHTKGEQEVNTLAMPMATPPTPPTARPGASPTPAC
250 260 270 280
>>CCDS65047.1 PAX5 gene_id:5079|Hs108|chr9 (357 aa)
initn: 695 init1: 695 opt: 759 Z-score: 532.1 bits: 107.2 E(32554): 2.6e-23
Smith-Waterman score: 761; 42.5% identity (66.8% similar) in 346 aa overlap (2-331:14-348)
10 20 30 40
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV
...:.::::::::::::::::: .::.::::::.:.::::::: :.:
CCDS65 MDLEKNYPTPRTSRTGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS
:.::::::::::::::::.: .::::::.::::.:: :::.:::. :..::::::::::.
CCDS65 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVEKIAEYKRQNPTMFAWEIRDRLLA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNG--QTGSWGTRPGW--YP
: :: ::..::::::::..:. ... .. . . .. .. :..: .: . :
CCDS65 ERVCDNDTVPSVSSINRIIRTKVQQPPNQPVPASSHSIVSTGSVTQVSSVSTDSAGSSYS
130 140 150 160 170 180
170 180 190 200 210
pF1KB7 GTSVPG--QPTQDGCQQQ--EGGGENT--NSISSNGEDSDEAQMRLQLKRKLQRNRTSFT
... : .:. : ... :: :. :. : :.: . ::: .: ::
CCDS65 ISGILGITSPSADTNKRKRDEGIQESPVPNGHSLPGRDFLRKQMRGDL----------FT
190 200 210 220 230
220 230 240 250 260 270
pF1KB7 QEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQA
:.:.:.:.. ::: :: :.:. . . : .. ... . . . .
CCDS65 QQQLEVLDRVFERQHYSDIFTTTEPIKPEQTTEYSAMASLAGGLDDMKANLASPTPADIG
240 250 260 270 280 290
280 290 300 310 320 330
pF1KB7 SNTPS--HIPI--SSSFSTSVYQPIPQPTTPVSS--FTSGSMLGRTDTALTNTYSALPPM
:..:. :: .: :: : :. :: .. .: : . ..:: . . .: ::
CCDS65 SSVPGPQSYPIVTGSEFSGSPYSH-PQYSSYNDSWRFPNPGLLGSPYYYSAAARGAAPPA
300 310 320 330 340
340 350 360 370 380 390
pF1KB7 PSFTMANNLPMQPPVPSQTSSYSCMLPTSPSVNGRSYDTYTPPHMQTHMNSQPMGTSGTT
CCDS65 AATAYDRH
350
>>CCDS42736.1 PAX8 gene_id:7849|Hs108|chr2 (321 aa)
initn: 764 init1: 679 opt: 758 Z-score: 532.0 bits: 107.1 E(32554): 2.6e-23
Smith-Waterman score: 758; 49.4% identity (75.9% similar) in 245 aa overlap (1-239:6-250)
10 20 30 40 50
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK
....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.:::::
CCDS42 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND
::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: ::
CCDS42 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP-
..::::::::..:. ... .. :. . :.: : .. : : .. :.
CCDS42 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY
130 140 150 160 170 180
180 190 200 210 220
pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF
. .: : . ..... .:: . .. : . . :. :: .:.:...: :: :
CCDS42 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS
:: :::...:
CCDS42 ERQHYPEAYASPSHTKGEQGERWWGPRCPDTHPTSPPADRAAMPPLPSQAWWQEVNTLAM
250 260 270 280 290 300
>>CCDS46399.1 PAX8 gene_id:7849|Hs108|chr2 (398 aa)
initn: 764 init1: 679 opt: 758 Z-score: 530.7 bits: 107.1 E(32554): 3.1e-23
Smith-Waterman score: 772; 37.0% identity (61.1% similar) in 427 aa overlap (1-412:6-394)
10 20 30 40 50
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSK
....:.:.:::::.::::::::. .::.::.:::.:.::::::: :.::.:::::
CCDS46 MPHNSIRSGHGGLNQLGGAFVNGRPLPEVVRQRIVDLAHQGVRPCDISRQLRVSHGCVSK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB7 ILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTND
::::::::::::: .::::::.::::.:: ::..:::. :..::::::::::.:::: ::
CCDS46 ILGRYYETGSIRPGVIGGSKPKVATPKVVEKIGDYKRQNPTMFAWEIRDRLLAEGVCDND
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB7 NIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNGQT--GSWGTRPGWYPGTSVPGQP-
..::::::::..:. ... .. :. . :.: : .. : : .. :.
CCDS46 TVPSVSSINRIIRTKVQQPFNLPMDSCVATKSLSPGHTLIPSSAVTPPESPQSDSLGSTY
130 140 150 160 170 180
180 190 200 210 220
pF1KB7 TQDGCQQQEGGGENTNSISSNGEDSDEAQMRLQLKRKLQRN--RT-SFTQEQIEALEKEF
. .: : . ..... .:: . .. : . . :. :: .:.:...: :: :
CCDS46 SINGLLGIAQPGSDKRKMDDSDQDSCRLSIDSQSSSSGPRKHLRTDAFSQHHLEPLECPF
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB7 ERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQASNTPSHIPISS
:: :::...: .. .. . . : : . . :. :::. :..
CCDS46 ERQHYPEAYASP---SHTKGEQGLYPLPLLNST--------LDDGK--ATLTPSNTPLGR
250 260 270 280
290 300 310 320 330 340
pF1KB7 SFSTSVYQPIPQPTTPVSSFTSGSMLGRTDTALTNTYSALPPMPSFTMANNLPMQPPVPS
..:: .: : ..: . : : : : :: .:: :: .
CCDS46 NLST--HQTYPVVAAPPFWICSKSAPGSR-----------PSMP-------FPMLPPCTG
290 300 310 320
350 360 370 380 390 400
pF1KB7 QTSSYSCMLPTSPSV---NGRSYDTY--TPPHMQTHMNSQPMGT----SGTTSTGLISPG
.. . :.: . . : ::. .:: .. : : . .: . . .:
CCDS46 SSRAR----PSSQGERWWGPRCPDTHPTSPPADRAAMPPLPSQAWWQEVNTLAMPMATPP
330 340 350 360 370 380
410 420
pF1KB7 VSVPVQVPGSEPDMSQYWPRLQ
. :. ::. :
CCDS46 TP-PTARPGASPTPAC
390
>>CCDS65044.1 PAX5 gene_id:5079|Hs108|chr9 (295 aa)
initn: 743 init1: 683 opt: 755 Z-score: 530.5 bits: 106.7 E(32554): 3.1e-23
Smith-Waterman score: 757; 51.8% identity (75.3% similar) in 247 aa overlap (2-238:14-250)
10 20 30 40
pF1KB7 MQNSHSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQV
...:.::::::::::::::::: .::.::::::.:.::::::: :.:
CCDS65 MDLEKNYPTPRTSRTGHGGVNQLGGVFVNGRPLPDVVRQRIVELAHQGVRPCDISRQLRV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 SNGCVSKILGRYYETGSIRPRAIGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLS
:.::::::::::::::::.: .::::::.::::.:: :::.:::. :..::::::::::.
CCDS65 SHGCVSKILGRYYETGSIKPGVIGGSKPKVATPKVVEKIAEYKRQNPTMFAWEIRDRLLA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB7 EGVCTNDNIPSVSSINRVLRNLASEKQQMGADGMYDKLRMLNG--QTGSWGTRPGW--YP
: :: ::..::::::::..:. ... .. . . .. .. :..: .: . :
CCDS65 ERVCDNDTVPSVSSINRIIRTKVQQPPNQPVPASSHSIVSTGSVTQVSSVSTDSAGSSYS
130 140 150 160 170 180
170 180 190 200 210
pF1KB7 GTSVPG--QPTQDGCQQQ--EGGGENT--NSISSNGEDSDEAQMRLQLKRKLQRNRTSFT
... : .:. : ... :: :. :. : :.: . ::: .: ::
CCDS65 ISGILGITSPSADTNKRKRDEGIQESPVPNGHSLPGRDFLRKQMRGDL----------FT
190 200 210 220 230
220 230 240 250 260 270
pF1KB7 QEQIEALEKEFERTHYPDVFARERLAAKIDLPEARIQVWFSNRRAKWRREEKLRNQRRQA
:.:.:.:.. ::: :: :.:
CCDS65 QQQLEVLDRVFERQHYSDIFTTTEPIKPEQAPPTIIALPPEEPPHLQPPLPMTVTDPWSQ
240 250 260 270 280 290
422 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 14:50:41 2016 done: Sat Nov 5 14:50:42 2016
Total Scan time: 3.410 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]