FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0069, 738 aa
1>>>pF1KE0069 738 - 738 aa - 738 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4689+/-0.000844; mu= 19.2317+/- 0.051
mean_var=66.7407+/-13.383, 0's: 0 Z-trim(106.2): 15 B-trim: 0 in 0/52
Lambda= 0.156992
statistics sampled from 8858 (8868) to 8858 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.272), width: 16
Scan time: 3.950
The best scores are: opt bits E(32554)
CCDS3325.1 MELTF gene_id:4241|Hs108|chr3 ( 738) 5067 1156.9 0
CCDS3326.1 MELTF gene_id:4241|Hs108|chr3 ( 302) 1614 374.6 1.2e-103
CCDS56251.1 LTF gene_id:4057|Hs108|chr3 ( 666) 899 212.8 1.4e-54
CCDS33747.1 LTF gene_id:4057|Hs108|chr3 ( 710) 899 212.8 1.5e-54
CCDS82763.1 LTF gene_id:4057|Hs108|chr3 ( 708) 836 198.6 2.9e-50
CCDS3080.1 TF gene_id:7018|Hs108|chr3 ( 698) 606 146.5 1.4e-34
>>CCDS3325.1 MELTF gene_id:4241|Hs108|chr3 (738 aa)
initn: 5067 init1: 5067 opt: 5067 Z-score: 6194.7 bits: 1156.9 E(32554): 0
Smith-Waterman score: 5067; 100.0% identity (100.0% similar) in 738 aa overlap (1-738:1-738)
10 20 30 40 50 60
pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 LPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGGLIFRLLNEGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGGLIFRLLNEGQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 RLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQTYEAWLGHEYLHAMKGLLCDPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQTYEAWLGHEYLHAMKGLLCDPN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 RLPPYLRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAKSPQHCMERIQAEQVDAVTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RLPPYLRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAKSPQHCMERIQAEQVDAVTL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 SGEDIYTAGKTYGLVPAAGEHYAPEDSSNSYYVVAVVRRDSSHAFTLDELRGKRSCHAGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SGEDIYTAGKTYGLVPAAGEHYAPEDSSNSYYVVAVVRRDSSHAFTLDELRGKRSCHAGF
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 GSPAGWDVPVGALIQRGFIRPKDCDVLTAVSEFFNASCVPVNNPKNYPSSLCALCVGDEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GSPAGWDVPVGALIQRGFIRPKDCDVLTAVSEFFNASCVPVNNPKNYPSSLCALCVGDEQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 GRNKCVGNSQERYYGYRGAFRCLVENAGDVAFVRHTTVFDNTNGHNSEPWAAELRSEDYE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GRNKCVGNSQERYYGYRGAFRCLVENAGDVAFVRHTTVFDNTNGHNSEPWAAELRSEDYE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 LLCPNGARAEVSQFAACNLAQIPPHAVMVRPDTNIFTVYGLLDKAQDLFGDDHNKNGFKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LLCPNGARAEVSQFAACNLAQIPPHAVMVRPDTNIFTVYGLLDKAQDLFGDDHNKNGFKM
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 FDSSNYHGQDLLFKDATVRAVPVGEKTTYRGWLGLDYVAALEGMSSQQCSGAAAPAPGAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FDSSNYHGQDLLFKDATVRAVPVGEKTTYRGWLGLDYVAALEGMSSQQCSGAAAPAPGAP
670 680 690 700 710 720
730
pF1KE0 LLPLLLPALAARLLPPAL
::::::::::::::::::
CCDS33 LLPLLLPALAARLLPPAL
730
>>CCDS3326.1 MELTF gene_id:4241|Hs108|chr3 (302 aa)
initn: 1639 init1: 1612 opt: 1614 Z-score: 1974.0 bits: 374.6 E(32554): 1.2e-103
Smith-Waterman score: 1614; 94.2% identity (95.7% similar) in 258 aa overlap (1-257:1-256)
10 20 30 40 50 60
pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DHCVQLIAAQEADAITLDGGAIYEAGKEHGLKPVVGEVYDQEVGTSYYAVAVVRRSSHVT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 IDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::: .
CCDS33 YSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDES-
190 200 210 220 230
250 260 270 280 290
pF1KE0 LPSWGQALL-SQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGGLIFRLLNEG
:: :. :.. : :
CCDS33 -PSRRQTWTRSEEEEGECPAHEEARRTMRSSAGQAWKWAPVHRPQDESDKGEFGKRAKSR
240 250 260 270 280 290
>>CCDS56251.1 LTF gene_id:4057|Hs108|chr3 (666 aa)
initn: 702 init1: 461 opt: 899 Z-score: 1093.5 bits: 212.8 E(32554): 1.4e-54
Smith-Waterman score: 1582; 40.9% identity (67.4% similar) in 687 aa overlap (50-710:7-653)
20 30 40 50 60 70
pF1KE0 GMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLCVRGTSADHCVQLIAAQEADAITLDG
: . :.. : .:.: :: ..:::.::::
CCDS56 MRKVRGPPVSCIKRDSPIQCIQAIAENRADAVTLDG
10 20 30
80 90 100 110 120 130
pF1KE0 GAIYEAG-KEHGLKPVVGEVYDQEVG--TSYYAVAVVRRSSHVTIDTLKGVKSCHTGINR
: ::::: . :.::..::: : : :::::::.... .. :.:.::::::. :
CCDS56 GFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVAVVKKGGSFQLNELQGLKSCHTGLRR
40 50 60 70 80 90
140 150 160 170 180 190
pF1KE0 TVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCVPGAGETSYSESLCRLCRGDSSGE
:.:::::.: : . . ::. .:..:::::: . .. .::::: : .::
CCDS56 TAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSASCVPGADKGQFP-NLCRLCAG--TGE
100 110 120 130 140 150
200 210 220 230 240 250
pF1KE0 GVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVLENTDGKTLPSWGQALLSQDFELL
. : : : :..:::::.:: .:::::::...:::.:. . .. ...:::
CCDS56 NKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIRESTVFEDLSDEAE--------RDEYELL
160 170 180 190 200
260 270 280 290 300 310
pF1KE0 CRDGSRADVTEWRQCHLARVPAHAVVVRADTDG--GLIFRLLNEGQRLFSHEGS-SFQMF
: :..: : ....:::::::.::::.:. ..: :. :: ..:. :... : .::.:
CCDS56 CPDNTRKPVDKFKDCHLARVPSHAVVARS-VNGKEDAIWNLLRQAQEKFGKDKSPKFQLF
210 220 230 240 250 260
320 330 340 350 360
pF1KE0 SSEAYGQKDLLFKDST---SELVP-IATQTYEAWLGHEYLHAMKGLLCDPNRLPPY---L
.: . ::::::::::. :.. : : . : :: :. :...: . ... .
CCDS56 GSPS-GQKDLLFKDSAIGFSRVPPRIDSGLY---LGSGYFTAIQNLRKSEEEVAARRARV
270 280 290 300 310 320
370 380 390 400 410 420
pF1KE0 RWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAKSPQHCMERIQAEQVDAVTLSGEDIY
::... :..::.. . . . : ::.. . :. . ..::..:.: .:
CCDS56 VWCAVGEQELRKCNQWS-----GLSEGSVTCSSASTTEDCIALVLKGEADAMSLDGGYVY
330 340 350 360 370
430 440 450 460 470
pF1KE0 TAGKTYGLVPAAGEHYAPEDSSN-----------SYYVVAVVRRDSSHAFTLDELRGKRS
:::: ::::. .:.: ..::. .: .:::::: :. ..: . ..::.:
CCDS56 TAGKC-GLVPVLAENYKSQQSSDPDPNCVDRPVEGYLAVAVVRR-SDTSLTWNSVKGKKS
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE0 CHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLTAVSEFFNASCVPVNNPKNYPSSLCALC
::.. :::..:.: : : . .: .:.:. ::.: ..:. :.:::::
CCDS56 CHTAVDRTAGWNIPMGLL----FNQTGSCKF----DEYFSQSCAPGSDPR---SNLCALC
440 450 460 470 480
540 550 560 570 580 590
pF1KE0 VGDEQGRNKCVGNSQERYYGYRGAFRCLVENAGDVAFVRHTTVFDNTNGHNSEPWAAELR
.:::::.:::: ::.:::::: ::::::.:::::::::. .::..::.:.:.: :: .:.
CCDS56 IGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDVAFVKDVTVLQNTDGNNNEAWAKDLK
490 500 510 520 530 540
600 610 620 630 640 650
pF1KE0 SEDYELLCPNGARAEVSQFAACNLAQIPPHAVMVRPDTNIFTVYGLLDKAQDLFGDDHNK
:. ::: .: : :.. .:.::. : :::. : : .. . .: . : :: . .
CCDS56 LADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSRMD-KVERLKQVLLHQQAKFGRNGSD
550 560 570 580 590 600
660 670 680 690 700 710
pF1KE0 --NGFKMFDSSNYHGQDLLFKDATVRAVPVGEKTTYRGWLGLDYVAALEGMSSQQCSGAA
. : .:.: . ..:::.: : . . ::::. .:: .:::.. .. ..::
CCDS56 CPDKFCLFQSET---KNLLFNDNTECLARLHGKTTYEKYLGPQYVAGITNL--KKCSTSP
610 620 630 640 650
720 730
pF1KE0 APAPGAPLLPLLLPALAARLLPPAL
CCDS56 LLEACEFLRK
660
>>CCDS33747.1 LTF gene_id:4057|Hs108|chr3 (710 aa)
initn: 1039 init1: 461 opt: 899 Z-score: 1093.1 bits: 212.8 E(32554): 1.5e-54
Smith-Waterman score: 1652; 40.8% identity (66.9% similar) in 731 aa overlap (6-710:12-697)
10 20 30 40 50
pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLC
::: : :: : :.:::.:.:: :: . .. .:.. : . :
CCDS33 MKLVFLVLLFLGALGLCLAGRR----RSVQWCAVSQPEATKCFQWQRNMRKVR-GPPVSC
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 VRGTSADHCVQLIAAQEADAITLDGGAIYEAG-KEHGLKPVVGEVYDQEVG--TSYYAVA
.. : .:.: :: ..:::.::::: ::::: . :.::..::: : : :::::
CCDS33 IKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 VVRRSSHVTIDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGS
::.... .. :.:.::::::. ::.:::::.: : . . ::. .:..:
CCDS33 VVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSAS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 CVPGAGETSYSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHST
::::: . .. .::::: : .::. : : : :..:::::.:: .:::::::...::
CCDS33 CVPGADKGQFP-NLCRLCAG--TGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIREST
180 190 200 210 220 230
240 250 260 270 280
pF1KE0 VLENTDGKTLPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDG--
:.:. . .. ...:::: :..: : ....:::::::.::::.:. ..:
CCDS33 VFEDLSDEAE--------RDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARS-VNGKE
240 250 260 270 280
290 300 310 320 330 340
pF1KE0 GLIFRLLNEGQRLFSHEGS-SFQMFSSEAYGQKDLLFKDST---SELVP-IATQTYEAWL
:. :: ..:. :... : .::.:.: . ::::::::::. :.. : : . : :
CCDS33 DAIWNLLRQAQEKFGKDKSPKFQLFGSPS-GQKDLLFKDSAIGFSRVPPRIDSGLY---L
290 300 310 320 330
350 360 370 380 390 400
pF1KE0 GHEYLHAMKGLLCDPNRLPPY---LRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAK
: :. :...: . ... . ::... :..::.. . . . : ::.
CCDS33 GSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWS-----GLSEGSVTCSSAS
340 350 360 370 380 390
410 420 430 440 450
pF1KE0 SPQHCMERIQAEQVDAVTLSGEDIYTAGKTYGLVPAAGEHYAPEDSSN-----------S
. . :. . ..::..:.: .::::: ::::. .:.: ..::. .
CCDS33 TTEDCIALVLKGEADAMSLDGGYVYTAGKC-GLVPVLAENYKSQQSSDPDPNCVDRPVEG
400 410 420 430 440 450
460 470 480 490 500 510
pF1KE0 YYVVAVVRRDSSHAFTLDELRGKRSCHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLTAV
: .:::::: :. ..: . ..::.:::.. :::..:.: : : . .:
CCDS33 YLAVAVVRR-SDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLL----FNQTGSCKF----
460 470 480 490 500
520 530 540 550 560 570
pF1KE0 SEFFNASCVPVNNPKNYPSSLCALCVGDEQGRNKCVGNSQERYYGYRGAFRCLVENAGDV
.:.:. ::.: ..:. :.:::::.:::::.:::: ::.:::::: ::::::.::::::
CCDS33 DEYFSQSCAPGSDPR---SNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDV
510 520 530 540 550 560
580 590 600 610 620 630
pF1KE0 AFVRHTTVFDNTNGHNSEPWAAELRSEDYELLCPNGARAEVSQFAACNLAQIPPHAVMVR
:::. .::..::.:.:.: :: .:. :. ::: .: : :.. .:.::. : :::. :
CCDS33 AFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSR
570 580 590 600 610 620
640 650 660 670 680
pF1KE0 PDTNIFTVYGLLDKAQDLFGDDHNK--NGFKMFDSSNYHGQDLLFKDATVRAVPVGEKTT
: .. . .: . : :: . . . : .:.: . ..:::.: : . . :::
CCDS33 MD-KVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSET---KNLLFNDNTECLARLHGKTT
630 640 650 660 670
690 700 710 720 730
pF1KE0 YRGWLGLDYVAALEGMSSQQCSGAAAPAPGAPLLPLLLPALAARLLPPAL
:. .:: .:::.. .. ..::
CCDS33 YEKYLGPQYVAGITNL--KKCSTSPLLEACEFLRK
680 690 700 710
>>CCDS82763.1 LTF gene_id:4057|Hs108|chr3 (708 aa)
initn: 1037 init1: 461 opt: 836 Z-score: 1016.0 bits: 198.6 E(32554): 2.9e-50
Smith-Waterman score: 1641; 40.9% identity (67.2% similar) in 731 aa overlap (6-710:12-695)
10 20 30 40 50
pF1KE0 MRGPSGALWLLLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREAGIQPSLLC
::: : :: : :.:::.:.:: :: . .. .:.. : . :
CCDS82 MKLVFLVLLFLGALGLCLAGRR----RSVQWCAVSQPEATKCFQWQRNMRKVR-GPPVSC
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 VRGTSADHCVQLIAAQEADAITLDGGAIYEAG-KEHGLKPVVGEVYDQEVG--TSYYAVA
.. : .:.: :: ..:::.::::: ::::: . :.::..::: : : :::::
CCDS82 IKRDSPIQCIQAIAENRADAVTLDGGFIYEAGLAPYKLRPVAAEVYGTERQPRTHYYAVA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 VVRRSSHVTIDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGS
::.... .. :.:.::::::. ::.:::::.: : . . ::. .:..:
CCDS82 VVKKGGSFQLNELQGLKSCHTGLRRTAGWNVPIGTLRPFLNWTGPPEPIEAAVARFFSAS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 CVPGAGETSYSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHST
::::: . .. .::::: : .::. : : : :..:::::.:: .:::::::...::
CCDS82 CVPGADKGQFP-NLCRLCAG--TGENKCAFSSQEPYFSYSGAFKCLRDGAGDVAFIREST
180 190 200 210 220 230
240 250 260 270 280
pF1KE0 VLENTDGKTLPSWGQALLSQDFELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDG--
:.:. . .. ...:::: :..: : ....:::::::.::::.:. ..:
CCDS82 VFEDLSDEAE--------RDEYELLCPDNTRKPVDKFKDCHLARVPSHAVVARS-VNGKE
240 250 260 270 280
290 300 310 320 330 340
pF1KE0 GLIFRLLNEGQRLFSHEGS-SFQMFSSEAYGQKDLLFKDST---SELVP-IATQTYEAWL
:. :: ..:. :... : .::.:.: . ::::::::::. :.. : : . : :
CCDS82 DAIWNLLRQAQEKFGKDKSPKFQLFGSPS-GQKDLLFKDSAIGFSRVPPRIDSGLY---L
290 300 310 320 330
350 360 370 380 390 400
pF1KE0 GHEYLHAMKGLLCDPNRLPPY---LRWCVLSTPEIQKCGDMAVAFRRQRLKPEIQCVSAK
: :. :...: . ... . ::... :..::.. . . . : ::.
CCDS82 GSGYFTAIQNLRKSEEEVAARRARVVWCAVGEQELRKCNQWS-----GLSEGSVTCSSAS
340 350 360 370 380 390
410 420 430 440 450
pF1KE0 SPQHCMERIQAEQVDAVTLSGEDIYTAGKTYGLVPAAGEHYAPEDSSN-----------S
. . :. ...: .::..:.: .::::: ::::. .:.: ..::. .
CCDS82 TTEDCIA-LKGE-ADAMSLDGGYVYTAGKC-GLVPVLAENYKSQQSSDPDPNCVDRPVEG
400 410 420 430 440 450
460 470 480 490 500 510
pF1KE0 YYVVAVVRRDSSHAFTLDELRGKRSCHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLTAV
: .:::::: :. ..: . ..::.:::.. :::..:.: : : . .:
CCDS82 YLAVAVVRR-SDTSLTWNSVKGKKSCHTAVDRTAGWNIPMGLL----FNQTGSCKF----
460 470 480 490 500
520 530 540 550 560 570
pF1KE0 SEFFNASCVPVNNPKNYPSSLCALCVGDEQGRNKCVGNSQERYYGYRGAFRCLVENAGDV
.:.:. ::.: ..:. :.:::::.:::::.:::: ::.:::::: ::::::.::::::
CCDS82 DEYFSQSCAPGSDPR---SNLCALCIGDEQGENKCVPNSNERYYGYTGAFRCLAENAGDV
510 520 530 540 550
580 590 600 610 620 630
pF1KE0 AFVRHTTVFDNTNGHNSEPWAAELRSEDYELLCPNGARAEVSQFAACNLAQIPPHAVMVR
:::. .::..::.:.:.: :: .:. :. ::: .: : :.. .:.::. : :::. :
CCDS82 AFVKDVTVLQNTDGNNNEAWAKDLKLADFALLCLDGKRKPVTEARSCHLAMAPNHAVVSR
560 570 580 590 600 610
640 650 660 670 680
pF1KE0 PDTNIFTVYGLLDKAQDLFGDDHNK--NGFKMFDSSNYHGQDLLFKDATVRAVPVGEKTT
: .. . .: . : :: . . . : .:.: . ..:::.: : . . :::
CCDS82 MD-KVERLKQVLLHQQAKFGRNGSDCPDKFCLFQSET---KNLLFNDNTECLARLHGKTT
620 630 640 650 660 670
690 700 710 720 730
pF1KE0 YRGWLGLDYVAALEGMSSQQCSGAAAPAPGAPLLPLLLPALAARLLPPAL
:. .:: .:::.. .. ..::
CCDS82 YEKYLGPQYVAGITNL--KKCSTSPLLEACEFLRK
680 690 700
>>CCDS3080.1 TF gene_id:7018|Hs108|chr3 (698 aa)
initn: 579 init1: 277 opt: 606 Z-score: 734.5 bits: 146.5 E(32554): 1.4e-34
Smith-Waterman score: 899; 39.6% identity (66.7% similar) in 414 aa overlap (310-710:301-685)
280 290 300 310 320 330
pF1KE0 AVVVRADTDGGLIFRLLNEGQRLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQT
::.::: .: ::::::::. .. . .
CCDS30 VARSMGGKEDLIWELLNQAQEHFGKDKSKEFQLFSSP-HG-KDLLFKDSAHGFLKVPPRM
280 290 300 310 320
340 350 360 370 380 390
pF1KE0 -YEAWLGHEYLHAMKGL---LCD--PNRLPPYLRWCVLSTPEIQKCGDMAVAFRRQRLKP
. .::.::. :...: : :. ..::.:: : :: . .:
CCDS30 DAKMYLGYEYVTAIRNLREGTCPEAPTDECKPVKWCALSHHERLKCDEWSVN-----SVG
330 340 350 360 370 380
400 410 420 430 440 450
pF1KE0 EIQCVSAKSPQHCMERIQAEQVDAVTLSGEDIYTAGKTYGLVPAAGEHYAPEDSSNS---
.:.::::.. . :. .:. ..::..:.: .: ::: ::::. .:.: :. ..
CCDS30 KIECVSAETTEDCIAKIMNGEADAMSLDGGFVYIAGKC-GLVPVLAENYNKSDNCEDTPE
390 400 410 420 430 440
460 470 480 490 500
pF1KE0 --YYVVAVVRRDSSHAFTLDELRGKRSCHAGFGSPAGWDVPVGALIQRGFIRPKDCDVLT
:...:::....: .: :.:.::.:::.. : :::..:.: : . . . :
CCDS30 AGYFAIAVVKKSASD-LTWDNLKGKKSCHTAVGRTAGWNIPMGLL----YNKINHCR---
450 460 470 480 490
510 520 530 540 550 560
pF1KE0 AVSEFFNASCVPVNNPKNYPSSLCALCVGDEQGRNKCVGNSQERYYGYRGAFRCLVENAG
.:::. .:.: .. :. :::: ::.:. : : : :..: :::: ::::::::. :
CCDS30 -FDEFFSEGCAP-GSKKD--SSLCKLCMGS--GLNLCEPNNKEGYYGYTGAFRCLVEK-G
500 510 520 530 540
570 580 590 600 610 620
pF1KE0 DVAFVRHTTVFDNTNGHNSEPWAAELRSEDYELLCPNGARAEVSQFAACNLAQIPPHAVM
:::::.: :: .::.:.: .::: .: .:::::: .:.: : ..: :.::. : :::.
CCDS30 DVAFVKHQTVPQNTGGKNPDPWAKNLNEKDYELLCLDGTRKPVEEYANCHLARAPNHAVV
550 560 570 580 590 600
630 640 650 660 670 680
pF1KE0 VRPDTNIFTVYGLLDKAQDLFGDD--HNKNGFKMFDSSNYHGQDLLFKDATVRAVPVGEK
.: : . :. .: . : :::.. ...: .: : . .::::.: :: . . ..
CCDS30 TRKDKEA-CVHKILRQQQHLFGSNVTDCSGNFCLFRSET---KDLLFRDDTVCLAKLHDR
610 620 630 640 650 660
690 700 710 720 730
pF1KE0 TTYRGWLGLDYVAALEGMSSQQCSGAAAPAPGAPLLPLLLPALAARLLPPAL
.::. .:: .:: :. .. ..::
CCDS30 NTYEKYLGEEYVKAVGNL--RKCSTSSLLEACTFRRP
670 680 690
>--
initn: 684 init1: 211 opt: 527 Z-score: 637.8 bits: 128.6 E(32554): 3.3e-29
Smith-Waterman score: 766; 42.9% identity (68.7% similar) in 319 aa overlap (1-308:1-298)
10 20 30 40 50
pF1KE0 MRGPSGALWL--LLALRTVLGGMEVRWCATSDPEQHKCGNMSEAFREA--GIQPSLLCVR
:: ::: . .:.: .. :::::.:. : :: .. . .. . . ::. ::.
CCDS30 MRLAVGALLVCAVLGLCLAVPDKTVRWCAVSEHEATKCQSFRDHMKSVIPSDGPSVACVK
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 GTSADHCVQLIAAQEADAITLDGGAIYEAG-KEHGLKPVVGEVYD--QEVGTSYYAVAVV
.: :.. :::.::::.:::.: .:.: ..:::::.: : .. : :::::::
CCDS30 KASYLDCIRAIAANEADAVTLDAGLVYDAYLAPNNLKPVVAEFYGSKEDPQTFYYAVAVV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 RRSSHVTIDTLKGVKSCHTGINRTVGWNVPVGYLVESGRLSVMGCDVLKAVSDYFGGSCV
...: .. :.: ::::::..:..:::.:.: : . : . :::...:.:::.
CCDS30 KKDSGFQMNQLRGKKSCHTGLGRSAGWNIPIGLLYCD--LPEPRKPLEKAVANFFSGSCA
130 140 150 160 170
180 190 200 210 220 230
pF1KE0 PGAGETSYSESLCRLCRGDSSGEGVCDKSPLERYYDYSGAFRCLAEGAGDVAFVKHSTVL
: : :.. . ::.:: : : : :..:. :::::.:: .::::::::::::..
CCDS30 PCADGTDFPQ-LCQLCPG-------CGCSTLNQYFGYSGAFKCLKDGAGDVAFVKHSTIF
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE0 ENTDGKTLPSWGQALLSQD-FELLCRDGSRADVTEWRQCHLARVPAHAVVVRADTDGG--
:: .:. ..: .:::: :..: : :...::::.::.:.::.: . ::
CCDS30 ENLANKA---------DRDQYELLCLDNTRKPVDEYKDCHLAQVPSHTVVAR--SMGGKE
240 250 260 270
300 310 320 330 340
pF1KE0 -LIFRLLNEGQRLFSHEGSSFQMFSSEAYGQKDLLFKDSTSELVPIATQTYEAWLGHEYL
::..:::..:. :... :
CCDS30 DLIWELLNQAQEHFGKDKSKEFQLFSSPHGKDLLFKDSAHGFLKVPPRMDAKMYLGYEYV
280 290 300 310 320 330
738 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 04:37:44 2016 done: Fri Nov 4 04:37:45 2016
Total Scan time: 3.950 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]