FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0036, 715 aa
1>>>pF1KE0036 715 - 715 aa - 715 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4996+/-0.000923; mu= 18.8307+/- 0.056
mean_var=71.0587+/-13.999, 0's: 0 Z-trim(105.2): 27 B-trim: 79 in 1/53
Lambda= 0.152148
statistics sampled from 8294 (8311) to 8294 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.625), E-opt: 0.2 (0.255), width: 16
Scan time: 3.150
The best scores are: opt bits E(32554)
CCDS11602.1 EPX gene_id:8288|Hs108|chr17 ( 715) 4868 1078.2 0
CCDS11604.1 MPO gene_id:4353|Hs108|chr17 ( 745) 3480 773.6 0
CCDS32689.1 LPO gene_id:4025|Hs108|chr17 ( 712) 2499 558.2 1.5e-158
CCDS54149.1 LPO gene_id:4025|Hs108|chr17 ( 629) 2387 533.6 3.4e-151
CCDS46221.1 PXDN gene_id:7837|Hs108|chr2 (1479) 1739 391.6 4.5e-108
CCDS47855.1 PXDNL gene_id:137902|Hs108|chr8 (1463) 1572 354.9 4.9e-97
CCDS1643.1 TPO gene_id:7173|Hs108|chr2 ( 933) 1388 314.4 4.8e-85
CCDS1646.1 TPO gene_id:7173|Hs108|chr2 ( 760) 988 226.6 1.1e-58
CCDS1644.1 TPO gene_id:7173|Hs108|chr2 ( 876) 533 126.7 1.4e-28
CCDS32221.1 DUOX1 gene_id:53905|Hs108|chr15 (1551) 479 115.0 8.6e-25
CCDS10117.1 DUOX2 gene_id:50506|Hs108|chr15 (1548) 474 113.9 1.8e-24
>>CCDS11602.1 EPX gene_id:8288|Hs108|chr17 (715 aa)
initn: 4868 init1: 4868 opt: 4868 Z-score: 5770.3 bits: 1078.2 E(32554): 0
Smith-Waterman score: 4868; 100.0% identity (100.0% similar) in 715 aa overlap (1-715:1-715)
10 20 30 40 50 60
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 RLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDVLTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDVLTE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 PQLRLLSQASGCALRDQAERCSDKYRTITGRCNNKRRPLLGASNQALARWLPAEYEDGLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PQLRLLSQASGCALRDQAERCSDKYRTITGRCNNKRRPLLGASNQALARWLPAEYEDGLS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 LPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSPE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 SPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQNKNRVRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQNKNRVRN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 QINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFDNLHDDPCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFDNLHDDPCL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 LTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGDKLYNEARK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGDKLYNEARK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 IMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAFRFGHTMLQPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 IMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAFRFGHTMLQPF
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 MFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNRQDAMLVDEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNRQDAMLVDEL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 RDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSRVLKNQDLAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSRVLKNQDLAR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 KFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFWWQKRGVFTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFWWQKRGVFTK
610 620 630 640 650 660
670 680 690 700 710
pF1KE0 RQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSAWRGT
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSAWRGT
670 680 690 700 710
>>CCDS11604.1 MPO gene_id:4353|Hs108|chr17 (745 aa)
initn: 3419 init1: 2842 opt: 3480 Z-score: 4123.5 bits: 773.6 E(32554): 0
Smith-Waterman score: 3480; 70.0% identity (87.2% similar) in 716 aa overlap (1-713:27-742)
10 20 30
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETS
:.:: ::::.:: :. :: ::. :: : :.::
CCDS11 MGVPFFSSLRCMVDLGPCWAGGLTAEMKLLLALAGLLAILATPQPSEGAAPAVLGEVDTS
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 VLRDCIAEAKLLVDAAYNWTQKSIKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMH
.. . . ::: ::: ::. ..::::::::::::::.::::::::::::::.::::::.:
CCDS11 LVLSSMEEAKQLVDKAYKERRESIKQRLRSGSASPMELLSYFKQPVAATRTAVRAADYLH
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 VALGLLEEKLQPQRSGPFNVTDVLTEPQLRLLSQASGCALRDQAERC--SDKYRTITGRC
::: :::.::. ::::::::: :: .::..:::: .: . : .:::::::: :
CCDS11 VALDLLERKLRSLWRRPFNVTDVLTPAQLNVLSKSSGCAYQDVGVTCPEQDKYRTITGMC
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE0 NNKRRPLLGASNQALARWLPAEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNE
::.: : :::::.:..::::::::::.:::.::::. .:::: . :.:::::.:::::..
CCDS11 NNRRSPTLGASNRAFVRWLPAEYEDGFSLPYGWTPGVKRNGFPVALARAVSNEIVRFPTD
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE0 RLTSDRGRALMFMQWGQFIDHDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPND
.:: :. :.::::::::..::::::.:: ::..:..::.:: .:.: :::::.::::::
CCDS11 QLTPDQERSLMFMQWGQLLDHDLDFTPEPAARASFVTGVNCETSCVQQPPCFPLKIPPND
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE0 PRIKNQRDCIPFFRSAPSCPQNKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYL
:::::: :::::::: :.:: .. .:::::::::::::::::::: :. ::: .: :
CCDS11 PRIKNQADCIPFFRSCPACPGSNITIRNQINALTSFVDASMVYGSEEPLARNLRNMSNQL
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE0 GLLAINQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFM
::::.:::::::::::::::::::::::::::::::::::::::::.: :.:..::::..
CCDS11 GLLAVNQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSSEMPELTSMHTLLL
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE0 REHNRLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYR
::::::::::. :::::.:..::.:::::.:::::::::::.:::::: . :. : ::
CCDS11 REHNRLATELKSLNPRWDGERLYQEARKIVGAMVQIITYRDYLPLVLGPTAMRKYLPTYR
430 440 450 460 470 480
460 470 480 490 500 510
pF1KE0 GYCSNVDPRVANVFTLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYE
.: ..::::.::::: :::.:::..::::::::..:. :: .:::: .::::::.: :
CCDS11 SYNDSVDPRIANVFTNAFRYGHTLIQPFMFRLDNRYQPMEPNPRVPLSRVFFASWRVVLE
490 500 510 520 530 540
520 530 540 550 560 570
pF1KE0 GGIDPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYN
::::::::::::::::::::. . :::.:.:::.:: :::::: ::::::::::::::::
CCDS11 GGIDPILRGLMATPAKLNRQNQIAVDEIRERLFEQVMRIGLDLPALNMQRSRDHGLPGYN
550 560 570 580 590 600
580 590 600 610 620 630
pF1KE0 AWRRFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPL
:::::::: ::....::. ::.: ::::... ::::.:::::.:...::: .:::::
CCDS11 AWRRFCGLPQPETVGQLGTVLRNLKLARKLMEQYGTPNNIDIWMGGVSEPLKRKGRVGPL
610 620 630 640 650 660
640 650 660 670 680 690
pF1KE0 LACLFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRD-IFRA
:::.. .:::. ::::::::...:::. .::.::..::: :::::::::::::.. :: .
CCDS11 LACIIGTQFRKLRDGDRFWWENEGVFSMQQRQALAQISLPRIICDNTGITTVSKNNIFMS
670 680 690 700 710 720
700 710
pF1KE0 NIYPRGFVNCSRIPRLNLSAWRGT
: ::: ::::: .: :::..::
CCDS11 NSYPRDFVNCSTLPALNLASWREAS
730 740
>>CCDS32689.1 LPO gene_id:4025|Hs108|chr17 (712 aa)
initn: 2219 init1: 1205 opt: 2499 Z-score: 2960.0 bits: 558.2 E(32554): 1.5e-158
Smith-Waterman score: 2499; 52.0% identity (76.9% similar) in 719 aa overlap (1-712:1-707)
10 20 30 40 50 60
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQ
:..: : ..::.:.: : .: :. ...::.. : ...::. :. :. .. .:
CCDS32 MRVLLHLPALLASLILLQAAASTTRAQ--TTRTSAISDTVSQAKVQVNKAFLDSRTRLKT
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 RLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDVLTE
. : . . .: :.:. . :::..: .. . .: :. :... ::::
CCDS32 AMSSETPTSRQLSEYLKHAKGRTRTAIRNGQVWEESLKRLR-----QKASLTNVTD----
60 70 80 90 100
130 140 150 160 170
pF1KE0 PQLRL--LSQASGCALRDQAERCS--DKYRTITGRCNNKRRPLLGASNQALARWLPAEYE
:.: : :: ::. . ::. . :::::: :::.:.: :::.:.:::::::::::
CCDS32 PSLDLTSLSLEVGCGAPAPVVRCDPCSPYRTITGDCNNRRKPALGAANRALARWLPAEYE
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE0 DGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLD
:::::::::::.. :::: :::.: :::.:: . ::. . :..:.:.::::::..:::::
CCDS32 DGLSLPFGWTPGKTRNGFPLPLAREVSNKIVGYLNEEGVLDQNRSLLFMQWGQIVDHDLD
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE0 FSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQN--
:.:.. . . ..:.. : : :::: .:::::. .: :.::::.. ::
CCDS32 FAPDTELGSSEYSKAQCDEYCIQGDNCFPIMFPPNDPKAGTQGKCMPFFRAGFVCPTPPY
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE0 KNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFDNL
:. .:.::::::::.:::.::.:: ::. :::: .. :::.:.::. .:.: ::.:.
CCDS32 KSLAREQINALTSFLDASFVYSSEPSLASRLRNLSSPLGLMAVNQEVSDHGLPYLPYDSK
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE0 HDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGDKL
. .:: . : .::.:::::::.:..: ::. ::::.::::::: ::.::::.:.:.::
CCDS32 KPSPCEFINTTARVPCFLAGDSRASEHILLATSHTLFLREHNRLARELKRLNPQWDGEKL
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE0 YNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAFRFGH
:.:::::.::.:::::.::.::..:: . .. . :.:: .::::..::::.::::::
CCDS32 YQEARKILGAFVQIITFRDYLPILLGD-HMQKWIPPYQGYSESVDPRISNVFTFAFRFGH
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE0 TMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNRQDA
. ::::: .:. .:. ..:: . :: .::.: .:::::..:::.: .:: .:.
CCDS32 LEVPSSMFRLDENYQPWGPEPELPLHTLFFNTWRMVKDGGIDPLVRGLLAKKSKLMKQNK
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE0 MLVDELRDRLFRQVRRI-GLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSRVL
:.. :::..::. ..:: :.::::.: :: :::: ::::.:: :: ::::..: .:. ::
CCDS32 MMTGELRNKLFQPTHRIHGFDLAAINTQRCRDHGQPGYNSWRAFCDLSQPQTLEELNTVL
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE0 KNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFWWQ
:.. ::.:.:.:::::::::::::::::::. .:::::::::. .::.. ::::::::.
CCDS32 KSKMLAKKLLGLYGTPDNIDIWIGAIAEPLVERGRVGPLLACLLGKQFQQIRDGDRFWWE
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE0 KRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSAWR
. ::::..:. .:...:.::..:::: :: : :: : :: :: ::.:: : .:.:: :
CCDS32 NPGVFTNEQKDSLQKMSFSRLVCDNTRITKVPRDPFWANSYPYDFVDCSAIDKLDLSPWA
650 660 670 680 690 700
pF1KE0 GT
CCDS32 SVKN
710
>>CCDS54149.1 LPO gene_id:4025|Hs108|chr17 (629 aa)
initn: 2219 init1: 1205 opt: 2387 Z-score: 2827.9 bits: 533.6 E(32554): 3.4e-151
Smith-Waterman score: 2387; 56.8% identity (80.3% similar) in 600 aa overlap (120-712:26-624)
90 100 110 120 130 140
pF1KE0 ADYMHVALGLLEEKLQPQRSGPFNVTDVLTEPQLRL--LSQASGCALRDQAERCS--DKY
.:.: : :: ::. . ::. . :
CCDS54 MRVLLHLPALLASLILLQAAASTTRDPSLDLTSLSLEVGCGAPAPVVRCDPCSPY
10 20 30 40 50
150 160 170 180 190 200
pF1KE0 RTITGRCNNKRRPLLGASNQALARWLPAEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQ
::::: :::.:.: :::.:.::::::::::::::::::::::.. :::: :::.: :::.
CCDS54 RTITGDCNNRRKPALGAANRALARWLPAEYEDGLSLPFGWTPGKTRNGFPLPLAREVSNK
60 70 80 90 100 110
210 220 230 240 250 260
pF1KE0 IVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSPESPARVAFTAGVDCERTCAQLPPCFP
:: . ::. . :..:.:.::::::..::::::.:.. . . ..:.. : : :::
CCDS54 IVGYLNEEGVLDQNRSLLFMQWGQIVDHDLDFAPDTELGSSEYSKAQCDEYCIQGDNCFP
120 130 140 150 160 170
270 280 290 300 310 320
pF1KE0 IKIPPNDPRIKNQRDCIPFFRSAPSCPQN--KNRVRNQINALTSFVDASMVYGSEVSLSL
: .:::::. .: :.::::.. :: :. .:.::::::::.:::.::.:: ::.
CCDS54 IMFPPNDPKAGTQGKCMPFFRAGFVCPTPPYKSLAREQINALTSFLDASFVYSSEPSLAS
180 190 200 210 220 230
330 340 350 360 370 380
pF1KE0 RLRNRTNYLGLLAINQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPK
:::: .. :::.:.::. .:.: ::.:. . .:: . : .::.:::::::.:..:
CCDS54 RLRNLSSPLGLMAVNQEVSDHGLPYLPYDSKKPSPCEFINTTARVPCFLAGDSRASEHIL
240 250 260 270 280 290
390 400 410 420 430 440
pF1KE0 LAAMHTLFMREHNRLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKAR
::. ::::.::::::: ::.::::.:.:.:::.:::::.::.:::::.::.::..:: .
CCDS54 LATSHTLFLREHNRLARELKRLNPQWDGEKLYQEARKILGAFVQIITFRDYLPILLGD-H
300 310 320 330 340 350
450 460 470 480 490 500
pF1KE0 ARRTLGHYRGYCSNVDPRVANVFTLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAF
.. . :.:: .::::..::::.:::::: . ::::: .:. .:. ..:: . :
CCDS54 MQKWIPPYQGYSESVDPRISNVFTFAFRFGHLEVPSSMFRLDENYQPWGPEPELPLHTLF
360 370 380 390 400 410
510 520 530 540 550 560
pF1KE0 FASWRIVYEGGIDPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRI-GLDLAALNMQR
: .::.: .:::::..:::.: .:: .:. :.. :::..::. ..:: :.::::.: ::
CCDS54 FNTWRMVKDGGIDPLVRGLLAKKSKLMKQNKMMTGELRNKLFQPTHRIHGFDLAAINTQR
420 430 440 450 460 470
570 580 590 600 610 620
pF1KE0 SRDHGLPGYNAWRRFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEP
:::: ::::.:: :: ::::..: .:. :::.. ::.:.:.::::::::::::::::::
CCDS54 CRDHGQPGYNSWRAFCDLSQPQTLEELNTVLKSKMLAKKLLGLYGTPDNIDIWIGAIAEP
480 490 500 510 520 530
630 640 650 660 670 680
pF1KE0 LLPGARVGPLLACLFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGIT
:. .:::::::::. .::.. ::::::::.. ::::..:. .:...:.::..:::: ::
CCDS54 LVERGRVGPLLACLLGKQFQQIRDGDRFWWENPGVFTNEQKDSLQKMSFSRLVCDNTRIT
540 550 560 570 580 590
690 700 710
pF1KE0 TVSRDIFRANIYPRGFVNCSRIPRLNLSAWRGT
: :: : :: :: ::.:: : .:.:: :
CCDS54 KVPRDPFWANSYPYDFVDCSAIDKLDLSPWASVKN
600 610 620
>>CCDS46221.1 PXDN gene_id:7837|Hs108|chr2 (1479 aa)
initn: 1199 init1: 633 opt: 1739 Z-score: 2053.6 bits: 391.6 E(32554): 4.5e-108
Smith-Waterman score: 1793; 41.7% identity (69.4% similar) in 696 aa overlap (40-713:628-1313)
10 20 30 40 50 60
pF1KE0 VLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSIKQRLRSGSASP
:.:: :: : : :. . . : ::
CCDS46 NTIGSASVSMVLSVNVPDVSRNGDPFVATSIVEAIATVDRAINSTRTHL---FDSRPRSP
600 610 620 630 640 650
70 80 90 100 110 120
pF1KE0 MDLLSYFKQPVAA-TRTVVRAADYMHVALGLLEEKLQP----QRSGP-FNVTDVLTEPQL
:::. :. : : .::.. .. .: :..:..: . .: .. .:... :
CCDS46 NDLLALFRYPRDPYTVEQARAGEIFERTLQLIQEHVQHGLMVDLNGTSYHYNDLVSPQYL
660 670 680 690 700 710
130 140 150 160 170
pF1KE0 RLLSQASGCALRDQAERCSD-----KYRTITGRCNNKRRPLLGASNQALARWLPAEYEDG
:... :::. . ... ::: :::: : ::: ..:. ::: :. : : . ::.:
CCDS46 NLIANLSGCTAHRRVNNCSDMCFHQKYRTHDGTCNNLQHPMWGASLTAFERLLKSVYENG
720 730 740 750 760 770
180 190 200 210 220 230
pF1KE0 LSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFS
.. : : .: : :: ::. : ::. .. .: .: :. . :.::::::.::::: .
CCDS46 FNTPRGINPHRLYNGHALPMPRLVSTTLI--GTETVTPDEQFTHMLMQWGQFLDHDLDST
780 790 800 810 820 830
240 250 260 270 280 290
pF1KE0 PESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCPQ-----
. ... :. : : .:.. :::: . ::::: : .. :. : ::.: : .
CCDS46 VVALSQARFSDGQHCSNVCSNDPPCFSVMIPPNDSRARSGARCMFFVRSSPVCGSGMTSL
840 850 860 870 880 890
300 310 320 330 340
pF1KE0 --NKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLL--AINQRFQDNGRALL
:. :.::: :::..::: :::: . .:. ... ::: .: :: .:. ::
CCDS46 LMNSVYPREQINQLTSYIDASNVYGSTEHEARSIRDLASHRGLLRQGIVQR---SGKPLL
900 910 920 930 940
350 360 370 380 390 400
pF1KE0 PFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRW
:: . :. . . :::::::: :..: :..::::..:::::.:::: .:::.:
CCDS46 PFATGPPTECMRDENESPIPCFLAGDHRANEQLGLTSMHTLWFREHNRIATELLKLNPHW
950 960 970 980 990 1000
410 420 430 440 450 460
pF1KE0 NGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVF-TL
.:: .: :.:::.:: .: :::. .:: .::.. . ::::.:.:: ... . :.: :
CCDS46 DGDTIYYETRKIVGAEIQHITYQHWLPKILGEV-GMRTLGEYHGYDPGINAGIFNAFATA
1010 1020 1030 1040 1050 1060
470 480 490 500 510 520
pF1KE0 AFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAK
:::::::...:...::: ... : . :.:: .:::. .::: ::::::.::::... .:
CCDS46 AFRFGHTLVNPLLYRLDENFQPIAQD-HLPLHKAFFSPFRIVNEGGIDPLLRGLFGVAGK
1070 1080 1090 1100 1110 1120
530 540 550 560 570 580
pF1KE0 LNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQ
. . .: :: .::: ... ..:::::.:.::.::::.: :. .: .:.:: ... .
CCDS46 MRVPSQLLNTELTERLFSMAHTVALDLAAINIQRGRDHGIPPYHDYRVYCNLSAAHTFED
1130 1140 1150 1160 1170 1180
590 600 610 620 630 640
pF1KE0 LSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGD
:. .:: .. .:. :::. :::.. . ..: :.::.:.:: : ::. .::.: ::::
CCDS46 LKNEIKNPEIREKLKRLYGSTLNIDLFPALVVEDLVPGSRLGPTLMCLLSTQFKRLRDGD
1190 1200 1210 1220 1230 1240
650 660 670 680 690 700
pF1KE0 RFWWQKRGVFTKRQRKALSRISLSRIICDNT-GITTVSRDIFRANIYPRGFVNCSRIPRL
:.:... :::. : ... ::.::.:::. .:: :. :.::. .:.:. .:..:::.
CCDS46 RLWYENPGVFSPAQLTQIKQTSLARILCDNADNITRVQSDVFRVAEFPHGYGSCDEIPRV
1250 1260 1270 1280 1290 1300
710
pF1KE0 NLSAWRGT
.: .:.
CCDS46 DLRVWQDCCEDCRTRGQFNAFSYHFRGRRSLEFSYQEDKPTKKTRPRKIPSVGRQGEHLS
1310 1320 1330 1340 1350 1360
>>CCDS47855.1 PXDNL gene_id:137902|Hs108|chr8 (1463 aa)
initn: 1045 init1: 622 opt: 1572 Z-score: 1855.6 bits: 354.9 E(32554): 4.9e-97
Smith-Waterman score: 1600; 39.1% identity (65.4% similar) in 705 aa overlap (31-713:610-1296)
10 20 30 40 50
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAAYNWTQKSI-K
::.:.: : . . ::.: : :.. . .
CCDS47 CVARNSFGLAVTNMFLTVTAIQGRQAGDDFVESSIL-DAVQR----VDSAINSTRRHLFS
580 590 600 610 620 630
60 70 80 90 100 110
pF1KE0 QRLRSGSASPMDLLSYFKQPVAATRT-VVRAADYMHVALGLLEEKLQPQ-----RSGPFN
:. ...: :::. :. : . ..::.. .. .: :..:... .. :
CCDS47 QKPHTSS----DLLAQFHYPRDPLIVEMARAGEIFEHTLQLIRERVKQGLTVDLEGKEFR
640 650 660 670 680 690
120 130 140 150 160
pF1KE0 VTDVLTEPQLRLLSQASGCALRDQAERCSD-----KYRTITGRCNNKRRPLLGASNQALA
.:... .: :... :::. : ::. :::. : ::: ..: ::. :.:
CCDS47 YNDLVSPRSLSLIANLSGCTARRPLPNCSNRCFHAKYRAHDGTCNNLQQPTWGAALTAFA
700 710 720 730 740 750
170 180 190 200 210 220
pF1KE0 RWLPAEYEDGLSLPFGW-TPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQW
: : :.::. : : : :. :: : :.. .: .: :.. . :.:.:
CCDS47 RLLQPAYRDGIRAPRGLGLPVGSRQP--LPPPRLVATVWAR--AAAVTPDHSYTRMLMHW
760 770 780 790 800
230 240 250 260 270 280
pF1KE0 GQFIDHDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRS
: :..:::: . . . . :. : : .:.. :::::.. ::: .. :. : ::
CCDS47 GWFLEHDLDHTVPALSTARFSDGRPCSSVCTNDPPCFPMNTRHADPR-GTHAPCMLFARS
810 820 830 840 850 860
290 300 310 320 330 340
pF1KE0 APSCPQNKNRV-------RNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQR
.:.: ... . :.::: :...:.: :::: : ::. . ::: .
CCDS47 SPACASGRPSATVDSVYAREQINQQTAYIDGSNVYGSSERESQALRDPSVPRGLLKTGFP
870 880 890 900 910 920
350 360 370 380 390 400
pF1KE0 FQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLAT
. .:. ::::.. : .. . ::::::: :..: :::::::..:::::.::
CCDS47 WPPSGKPLLPFSTGPPTECARQEQES--PCFLAGDHRANEHLALAAMHTLWFREHNRMAT
930 940 950 960 970 980
410 420 430 440 450 460
pF1KE0 ELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDP
:: :::.:.:. .:.:::::.:: .: ::: .:: ::: .: : :::: ::.
CCDS47 ELSALNPHWEGNTVYQEARKIVGAELQHITYSHWLPKVLGDPGTRMLRG-YRGYNPNVNA
990 1000 1010 1020 1030 1040
470 480 490 500 510
pF1KE0 RVANVF-TLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPIL
. : : : :::::::...:...::.. . ..:.:. .:.:. ::. ::::::.:
CCDS47 GIINSFATAAFRFGHTLINPILYRLNATL-GEISEGHLPFHKALFSPSRIIKEGGIDPVL
1050 1060 1070 1080 1090 1100
520 530 540 550 560 570
pF1KE0 RGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCG
:::... :: . .: :: .::: . ..: :: .::.::::.: : .: ::.
CCDS47 RGLFGVAAKWRAPSYLLSPELTQRLFSAAYSAAVDSAATIIQRGRDHGIPPYVDFRVFCN
1110 1120 1130 1140 1150 1160
580 590 600 610 620 630
pF1KE0 LSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFEN
:.. .:. .:. .:.... .:. .:::.: .::.: . ..: :.::.:::: : ::: .
CCDS47 LTSVKNFEDLQNEIKDSEIRQKLRKLYGSPGDIDLWPALMVEDLIPGTRVGPTLMCLFVT
1170 1180 1190 1200 1210 1220
640 650 660 670 680 690
pF1KE0 QFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDN-TGITTVSRDIFRANIYPRGF
::.: :::::::... :::: : :.. ::::..::: .: :. :.: ::. .
CCDS47 QFQRLRDGDRFWYENPGVFTPAQLTQLKQASLSRVLCDNGDSIQQVQADVFVKAEYPQDY
1230 1240 1250 1260 1270 1280
700 710
pF1KE0 VNCSRIPRLNLSAWRGT
.:::.::...: .:.
CCDS47 LNCSEIPKVDLRVWQDCCADCRSRGQFRAVTQESQKKRSAQYSYPVDKDMELSHLRSRQQ
1290 1300 1310 1320 1330 1340
>>CCDS1643.1 TPO gene_id:7173|Hs108|chr2 (933 aa)
initn: 1899 init1: 865 opt: 1388 Z-score: 1640.3 bits: 314.4 E(32554): 4.8e-85
Smith-Waterman score: 2053; 44.4% identity (70.3% similar) in 710 aa overlap (29-715:32-735)
10 20 30 40 50
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAA-YNWTQKS
: : : . . . :.: :::.: : :..
CCDS16 RALAVLSVTLVMACTEAFFPFISRGKELLWGKPEESRVSSVLEESKRLVDTAMYATMQRN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 IKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDV
.:.: : :: .:::. : : .. ...:::. :.... ...:.. . . . ::.
CCDS16 LKKR---GILSPAQLLSFSKLPEPTSGVIARAAEIMETSIQAMKRKVNLKTQQSQHPTDA
70 80 90 100 110
120 130 140 150 160 170
pF1KE0 LTEPQLRLLSQASGCALRDQAERC-----SDKYRTITGRCNNKRRPLLGASNQALARWLP
:.: : .... ::: .: ..::: ::: :::. .: :::: :::::::
CCDS16 LSEDLLSIIANMSGCLPYMLPPKCPNTCLANKYRPITGACNNRDHPRWGASNTALARWLP
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 AEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFID
::::.: : ::.:. ::: :: :: :. .... :: .:.: . ..: :::.::
CCDS16 PVYEDGFSQPRGWNPGFLYNGFPLPPVREVTRHVIQVSNEVVTDDDRYSDLLMAWGQYID
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 HDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCP
::. :.:.: ...:: .:.::. :: . :::::..: .. : :.::.::. .:
CCDS16 HDIAFTPQSTSKAAFGGGADCQMTCENQNPCFPIQLP-EEARPAAGTACLPFYRSSAACG
240 250 260 270 280 290
300 310 320 330 340
pF1KE0 QNKNRV----------RNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQ
. . . :.:.:.::::.::: :::: .: .::: :. ::: .. :..
CCDS16 TGDQGALFGNLSTANPRQQMNGLTSFLDASTVYGSSPALERQLRNWTSAEGLLRVHARLR
300 310 320 330 340 350
350 360 370 380 390
pF1KE0 DNGRALLPF------DNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHN
:.::: ::: .: . .: ::::::: :..:.:.:.:.:::..::::
CCDS16 DSGRAYLPFVPPRAPAACAPEPGI--PGETRGPCFLAGDGRASEVPSLTALHTLWLREHN
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 RLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCS
:::. :. :: .:..: .:.::::..::. :::: ::..: .:: .. .: :.:: :
CCDS16 RLAAALKALNAHWSADAVYQEARKVVGALHQIITLRDYIPRILGPEAFQQYVGPYEGYDS
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 NVDPRVANVF-TLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGI
...: :.::: : ::::::. ..:.. :::.... . : .:::. : .. ::.
CCDS16 TANPTVSNVFSTAAFRFGHATIHPLVRRLDASFQEHPDLPGLWLHQAFFSPWTLLRGGGL
480 490 500 510 520 530
520 530 540 550 560 570
pF1KE0 DPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWR
::..:::.: ::::. :: .. .:: .::: ::::..:.::.::::::::: ::
CCDS16 DPLIRGLLARPAKLQVQDQLMNEELTERLFVLSNSSTLDLASINLQRGRDHGLPGYNEWR
540 550 560 570 580 590
580 590 600 610 620 630
pF1KE0 RFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLAC
.:::: . .. :.:: .. ....: :.:.:: :::::.:.:..:: .:: ::.:::.::
CCDS16 EFCGLPRLETPADLSTAIASRSVADKILDLYKHPDNIDVWLGGLAENFLPRARTGPLFAC
600 610 620 630 640 650
640 650 660 670 680 690
pF1KE0 LFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYP
:. .:.. :::: :::.. ::: ::. : . ::::.::::::.: : : :... .:
CCDS16 LIGKQMKALRDGDWFWWENSHVFTDAQRRELEKHSLSRVICDNTGLTRVPMDAFQVGKFP
660 670 680 690 700 710
700 710
pF1KE0 RGFVNCSRIPRLNLSAWRGT
. : .:. : .:: ::: :
CCDS16 EDFESCDSITGMNLEAWRETFPQDDKCGFPESVENGDFVHCEESGRRVLVYSCRHGYELQ
720 730 740 750 760 770
>>CCDS1646.1 TPO gene_id:7173|Hs108|chr2 (760 aa)
initn: 1343 init1: 865 opt: 988 Z-score: 1167.1 bits: 226.6 E(32554): 1.1e-58
Smith-Waterman score: 1293; 34.7% identity (54.9% similar) in 694 aa overlap (29-715:32-562)
10 20 30 40 50
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAA-YNWTQKS
: : : . . . :.: :::.: : :..
CCDS16 RALAVLSVTLVMACTEAFFPFISRGKELLWGKPEESRVSSVLEESKRLVDTAMYATMQRN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 IKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDV
.:.: : :: .:::. : : .. ...:::. :.... ...:.. . . . ::.
CCDS16 LKKR---GILSPAQLLSFSKLPEPTSGVIARAAEIMETSIQAMKRKVNLKTQQSQHPTDA
70 80 90 100 110
120 130 140 150 160 170
pF1KE0 LTEPQLRLLSQASGCALRDQAERC-----SDKYRTITGRCNNKRRPLLGASNQALARWLP
:.: : .... ::: .: ..::: ::: :::. .: :::: :::::::
CCDS16 LSEDLLSIIANMSGCLPYMLPPKCPNTCLANKYRPITGACNNRDHPRWGASNTALARWLP
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 AEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFID
::::.: : ::.:. ::: :: :: :. .... :: .:.: . ..: :::.::
CCDS16 PVYEDGFSQPRGWNPGFLYNGFPLPPVREVTRHVIQVSNEVVTDDDRYSDLLMAWGQYID
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 HDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCP
::. :.:.: ...:: .:.::. :: . :::::
CCDS16 HDIAFTPQSTSKAAFGGGADCQMTCENQNPCFPI--------------------------
240 250 260 270
300 310 320 330 340 350
pF1KE0 QNKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQDNGRALLPFD
CCDS16 ------------------------------------------------------------
360 370 380 390 400 410
pF1KE0 NLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWNGD
CCDS16 ------------------------------------------------------------
420 430 440 450 460 470
pF1KE0 KLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVF-TLAFR
:::: ::..: .:: .. .: :.:: :...: :.::: : :::
CCDS16 --------------QIITLRDYIPRILGPEAFQQYVGPYEGYDSTANPTVSNVFSTAAFR
280 290 300 310
480 490 500 510 520 530
pF1KE0 FGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGIDPILRGLMATPAKLNR
:::. ..:.. :::.... . : .:::. : .. ::.::..:::.: ::::.
CCDS16 FGHATIHPLVRRLDASFQEHPDLPGLWLHQAFFSPWTLLRGGGLDPLIRGLLARPAKLQV
320 330 340 350 360 370
540 550 560 570 580 590
pF1KE0 QDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGLSQPRNLAQLSR
:: .. .:: .::: ::::..:.::.::::::::: ::.:::: . .. :.::
CCDS16 QDQLMNEELTERLFVLSNSSTLDLASINLQRGRDHGLPGYNEWREFCGLPRLETPADLST
380 390 400 410 420 430
600 610 620 630 640 650
pF1KE0 VLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLACLFENQFRRARDGDRFW
.. ....: :.:.:: :::::.:.:..:: .:: ::.:::.:::. .:.. :::: ::
CCDS16 AIASRSVADKILDLYKHPDNIDVWLGGLAENFLPRARTGPLFACLIGKQMKALRDGDWFW
440 450 460 470 480 490
660 670 680 690 700 710
pF1KE0 WQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYPRGFVNCSRIPRLNLSA
:.. ::: ::. : . ::::.::::::.: : : :... .:. : .:. : .:: :
CCDS16 WENSHVFTDAQRRELEKHSLSRVICDNTGLTRVPMDAFQVGKFPEDFESCDSITGMNLEA
500 510 520 530 540 550
pF1KE0 WRGT
:: :
CCDS16 WRETFPQDDKCGFPESVENGDFVHCEESGRRVLVYSCRHGYELQGREQLTCTQEGWDFQP
560 570 580 590 600 610
>>CCDS1644.1 TPO gene_id:7173|Hs108|chr2 (876 aa)
initn: 1668 init1: 533 opt: 533 Z-score: 626.4 bits: 126.7 E(32554): 1.4e-28
Smith-Waterman score: 1717; 40.3% identity (64.2% similar) in 710 aa overlap (29-715:32-678)
10 20 30 40 50
pF1KE0 MHLLPALAGVLATLVLAQPCEGTDPASPGAVETSVLRDCIAEAKLLVDAA-YNWTQKS
: : : . . . :.: :::.: : :..
CCDS16 RALAVLSVTLVMACTEAFFPFISRGKELLWGKPEESRVSSVLEESKRLVDTAMYATMQRN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 IKQRLRSGSASPMDLLSYFKQPVAATRTVVRAADYMHVALGLLEEKLQPQRSGPFNVTDV
.:.: : :: .:::. : : .. ...:::. :.... ...:.. . . . ::.
CCDS16 LKKR---GILSPAQLLSFSKLPEPTSGVIARAAEIMETSIQAMKRKVNLKTQQSQHPTDA
70 80 90 100 110
120 130 140 150 160 170
pF1KE0 LTEPQLRLLSQASGCALRDQAERC-----SDKYRTITGRCNNKRRPLLGASNQALARWLP
:.: : .... ::: .: ..::: ::: :::. .: :::: :::::::
CCDS16 LSEDLLSIIANMSGCLPYMLPPKCPNTCLANKYRPITGACNNRDHPRWGASNTALARWLP
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 AEYEDGLSLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFID
::::.: : ::.:. ::: :: :: :. .... :: .:.: . ..: :::.::
CCDS16 PVYEDGFSQPRGWNPGFLYNGFPLPPVREVTRHVIQVSNEVVTDDDRYSDLLMAWGQYID
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 HDLDFSPESPARVAFTAGVDCERTCAQLPPCFPIKIPPNDPRIKNQRDCIPFFRSAPSCP
::. :.:.: ...:: .:.::. :: . :::::..: .. : :.::.::. .:
CCDS16 HDIAFTPQSTSKAAFGGGADCQMTCENQNPCFPIQLP-EEARPAAGTACLPFYRSSAACG
240 250 260 270 280 290
300 310 320 330 340
pF1KE0 QNKNRV----------RNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAINQRFQ
. . . :.:.:.::::.::: :::: .: .::: :. ::: .. :..
CCDS16 TGDQGALFGNLSTANPRQQMNGLTSFLDASTVYGSSPALERQLRNWTSAEGLLRVHARLR
300 310 320 330 340 350
350 360 370 380 390
pF1KE0 DNGRALLPF------DNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHN
:.::: ::: .: . .: ::::::: :..:.:.:.:.:::..::::
CCDS16 DSGRAYLPFVPPRAPAACAPEPGI--PGETRGPCFLAGDGRASEVPSLTALHTLWLREHN
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 RLATELRRLNPRWNGDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCS
:::. :. :: .:..: .:.::::..::. :::: ::..: .:: .. .: :.:: :
CCDS16 RLAAALKALNAHWSADAVYQEARKVVGALHQIITLRDYIPRILGPEAFQQYVGPYEGYDS
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 NVDPRVANVF-TLAFRFGHTMLQPFMFRLDSQYRASAPNSHVPLSSAFFASWRIVYEGGI
...: :.::: : ::::::. ..:.. :::.... . : .:::. : .
CCDS16 TANPTVSNVFSTAAFRFGHATIHPLVRRLDASFQEHPDLPGLWLHQAFFSPWTL------
480 490 500 510 520
520 530 540 550 560 570
pF1KE0 DPILRGLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWR
::: ::: ::
CCDS16 ---LRG------------------------------------------------GYNEWR
530
580 590 600 610 620 630
pF1KE0 RFCGLSQPRNLAQLSRVLKNQDLARKFLNLYGTPDNIDIWIGAIAEPLLPGARVGPLLAC
.:::: . .. :.:: .. ....: :.:.:: :::::.:.:..:: .:: ::.:::.::
CCDS16 EFCGLPRLETPADLSTAIASRSVADKILDLYKHPDNIDVWLGGLAENFLPRARTGPLFAC
540 550 560 570 580 590
640 650 660 670 680 690
pF1KE0 LFENQFRRARDGDRFWWQKRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIYP
:. .:.. :::: :::.. ::: ::. : . ::::.::::::.: : : :... .:
CCDS16 LIGKQMKALRDGDWFWWENSHVFTDAQRRELEKHSLSRVICDNTGLTRVPMDAFQVGKFP
600 610 620 630 640 650
700 710
pF1KE0 RGFVNCSRIPRLNLSAWRGT
. : .:. : .:: ::: :
CCDS16 EDFESCDSITGMNLEAWRETFPQDDKCGFPESVENGDFVHCEESGRRVLVYSCRHGYELQ
660 670 680 690 700 710
>>CCDS32221.1 DUOX1 gene_id:53905|Hs108|chr15 (1551 aa)
initn: 209 init1: 128 opt: 479 Z-score: 558.6 bits: 115.0 E(32554): 8.6e-25
Smith-Waterman score: 554; 29.3% identity (53.0% similar) in 570 aa overlap (150-694:34-557)
120 130 140 150 160 170
pF1KE0 EPQLRLLSQASGCALRDQAERCSDKYRTITGRCNNKRRPLLGASNQALARWLPAEYEDGL
: :: . :.... : : .:: : ::.
CCDS32 CLALAWTLLVGAWTPLGAQNPISWEVQRFDGWYNNLMEHRWGSKGSRLQRLVPASYADGV
10 20 30 40 50 60
180 190 200 210 220 230
pF1KE0 SLPFGWTPSRRRNGFLLPLVRAVSNQIVRFPNERLTSDRGRALMFMQWGQFIDHDLDFSP
:.: : :: : .:: : : : :.: :.:... . .: . :: :
CCDS32 YQPLG-EPH-------LPNPRDLSNTISRGPAG-LASLRNRTVLGVFFGYHVLSDL-VSV
70 80 90 100 110
240 250 260 270 280 290
pF1KE0 ESPARVAFTAGVDCERTCAQLPPCF-PIKIPPNDPRIK-NQR-DCI-PFFRSA--PSCPQ
:.:. : : : :.:::.:: . .:: : . :: :: : .
CCDS32 ETPG-------------C---PAEFLNIRIPPGDPMFDPDQRGDVVLPFQRSRWDPETGR
120 130 140 150
300 310 320 330 340 350
pF1KE0 NKNRVRNQINALTSFVDASMVYGSEVSLSLRLRNRTNYLGLLAI--NQRF-QDNGRALLP
. . :. : .:...:.: .::: : : ::. . : :: . : .:. ::
CCDS32 SPSNPRDPANQVTGWLDGSAIYGSSHSWSDALRSFSR--GQLASGPDPAFPRDSQNPLLM
160 170 180 190 200 210
360 370 380 390 400 410
pF1KE0 FDNLHDDPCLLTNRSARIPCFLAGDTRSTETPKLAAMHTLFMREHNRLATELRRLNPRWN
. :: : . : : :... : : :. :..: :: : .: : .: :.
CCDS32 WAA--PDPATGQNGPRGLYAF--GAERGNREPFLQALGLLWFRYHNLWAQRLARQHPDWE
220 230 240 250 260 270
420 430 440 450 460 470
pF1KE0 GDKLYNEARKIMGAMVQIITYRDFLPLVLGKARARRTLGHYRGYCSNVDPRVANVFTLAF
..:...::: . : : :. ..:: : : :: .: :: .:: ... :. :
CCDS32 DEELFQHARKRVIATYQNIAVYEWLPSFLQK-----TLPEYTGYRPFLDPSISSEFVAAS
280 290 300 310 320
480 490 500 510 520
pF1KE0 -RFGHTMLQPFMF-RLDSQYRASAPNSHVPLSSAFFAS---WRIVYEG-----GIDPILR
.: ::. : .. : : . .. : . .: :. . : . . .: .:
CCDS32 EQFLSTMVPPGVYMRNASCHFQGVINRNSSVSRALRVCNSYWSREHPSLQSAEDVDALLL
330 340 350 360 370 380
530 540 550 560 570 580
pF1KE0 GLMATPAKLNRQDAMLVDELRDRLFRQVRRIGLDLAALNMQRSRDHGLPGYNAWRRFCGL
:. . :. :.: .::...:: .. : : .::.:: :::.:. : ::
CCDS32 GMASQIAE--REDHVLVEDVRDFWPGPLKFSRTDHLASCLQRGRDLGLPSYTKARAALGL
390 400 410 420 430 440
590 600 610 620 630
pF1KE0 SQPRNLAQLSRVLK--NQDLARKFLNLYGTPDNIDI-WIGAIAEPLLPGAR-VGPLLACL
: ... .:. :. . . :: : :. :. . :: . : :::.. .
CCDS32 SPITRWQDINPALSRSNDTVLEATAALY----NQDLSWLELLPGGLLESHRDPGPLFSTI
450 460 470 480 490 500
640 650 660 670 680 690
pF1KE0 FENQFRRARDGDRFWWQ--KRGVFTKRQRKALSRISLSRIICDNTGITTVSRDIFRANIY
.:: : :::::.:.. . :.:.:.. . . .:. .. ... ... . .. :..
CCDS32 VLEQFVRLRDGDRYWFENTRNGLFSKKEIEEIRNTTLQDVL---VAVINIDPSALQPNVF
510 520 530 540 550
700 710
pF1KE0 PRGFVNCSRIPRLNLSAWRGT
CCDS32 VWHKGDPCPQPRQLSTEGLPACAPSVVRDYFEGSGFGFGVTIGTLCCFPLVSLLSAWIVA
560 570 580 590 600 610
715 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 06:57:07 2016 done: Fri Nov 4 06:57:08 2016
Total Scan time: 3.150 Total Display time: 0.180
Function used was FASTA [36.3.4 Apr, 2011]