FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5749, 673 aa
1>>>pF1KE5749 673 - 673 aa - 673 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.8487+/-0.000983; mu= 1.0036+/- 0.060
mean_var=268.7052+/-55.296, 0's: 0 Z-trim(114.3): 13 B-trim: 158 in 1/52
Lambda= 0.078241
statistics sampled from 14880 (14893) to 14880 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.757), E-opt: 0.2 (0.457), width: 16
Scan time: 4.250
The best scores are: opt bits E(32554)
CCDS45604.1 FXR2 gene_id:9513|Hs108|chr17 ( 673) 4489 520.1 4e-147
CCDS46965.1 FXR1 gene_id:8087|Hs108|chr3 ( 539) 2010 240.2 5.8e-63
CCDS3238.1 FXR1 gene_id:8087|Hs108|chr3 ( 621) 2010 240.3 6.4e-63
CCDS55518.1 FMR1 gene_id:2332|Hs108|chrX ( 537) 1604 194.4 3.6e-49
CCDS76039.1 FMR1 gene_id:2332|Hs108|chrX ( 586) 1604 194.4 3.9e-49
CCDS55519.1 FMR1 gene_id:2332|Hs108|chrX ( 611) 1604 194.4 4e-49
CCDS14682.1 FMR1 gene_id:2332|Hs108|chrX ( 632) 1604 194.4 4.1e-49
CCDS33894.1 FXR1 gene_id:8087|Hs108|chr3 ( 536) 1509 183.7 6.1e-46
>>CCDS45604.1 FXR2 gene_id:9513|Hs108|chr17 (673 aa)
initn: 4489 init1: 4489 opt: 4489 Z-score: 2754.9 bits: 520.1 E(32554): 4e-147
Smith-Waterman score: 4489; 100.0% identity (100.0% similar) in 673 aa overlap (1-673:1-673)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 ATRTYGGSYGGRGRGRRTGGPAYGPSSDVSTASETESEKREEPNRAGPGDRDPPTRGEES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ATRTYGGSYGGRGRGRRTGGPAYGPSSDVSTASETESEKREEPNRAGPGDRDPPTRGEES
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE5 RRRPTGGRGRGPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RRRPTGGRGRGPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE5 ASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRRNRGNRTDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRRNRGNRTDG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE5 SISGDRQPVTVADYISRAESQSRQRPPLERTKPSEDSLSGQKGDSVSKLPKGPSENGELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SISGDRQPVTVADYISRAESQSRQRPPLERTKPSEDSLSGQKGDSVSKLPKGPSENGELS
610 620 630 640 650 660
670
pF1KE5 APLELGSMVNGVS
:::::::::::::
CCDS45 APLELGSMVNGVS
670
>>CCDS46965.1 FXR1 gene_id:8087|Hs108|chr3 (539 aa)
initn: 2289 init1: 1985 opt: 2010 Z-score: 1243.9 bits: 240.2 E(32554): 5.8e-63
Smith-Waterman score: 2364; 65.8% identity (82.0% similar) in 571 aa overlap (14-576:4-534)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
: ::::::::::::::.:::::::.:. :::::: :::.::..::::
CCDS46 MAELTVEVRGSNGAFYKGFIKDVHEDSLTVVFENNWQPERQVPFNEVRLP
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
:: : .:::.::::::::::::.:::::::::.::::::.::::::::::::::::::.:
CCDS46 PPPDIKKEISEGDEVEVYSRANDQEPCGWWLAKVRMMKGEFYVIEYAACDATYNEIVTFE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
:::::: : . :..::: :. :::::::::.:::.::.::::.:: :: . ...:.:
CCDS46 RLRPVNQNKTVKKNTFFKCTVDVPEDLREACANENAHKDFKKAVGACRIFYHPETTQLMI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
::..:: :::...:.:::.::.::::.::::::::::::: .:::::::.:::.::::::
CCDS46 LSASEATVKRVNILSDMHLRSIRTKLMLMSRNEEATKHLECTKQLAAAFHEEFVVREDLM
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
::::::::.:::::::::::::::: :.: :::::::. .: ..::..::: :: .::::
CCDS46 GLAIGTHGSNIQQARKVPGVTAIELDEDTGTFRIYGESADAVKKARGFLEFVEDFIQVPR
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL
:::::::::::::::::::::::::::.::::..: :::.:::::.::::.:.:.:.:.:
CCDS46 NLVGKVIGKNGKVIQEIVDKSGVVRVRIEGDNENKLPREDGMVPFVFVGTKESIGNVQVL
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH
::::..::.::::::.:::::::::::::
CCDS46 LEYHIAYLKEVEQLRMERLQIDEQLRQIG-------------------------------
360 370
430 440 450 460 470
pF1KE5 ATRTYGGSYGGRGRGRRTGGP----AYGPSSDVSTASETESEKREEPNR---AGPGDRDP
.: ::.::::::: :: .:: .:..:. ::::::...: . :: :::
CCDS46 -SR----SYSGRGRGRR--GPNYTSGYGTNSELSNPSETESERKDELSDWSLAGEDDRDS
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE5 PTRGEESRRRPTGGRGRGPPPA-PRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVD
. ..::::: :::::. . : : ..:::::::::::::::::::..: . .:
CCDS46 -RHQRDSRRRP-GGRGRSVSGGRGRGGPRGGKSSISSVLKDPDSNPYSLLDNTESDQTAD
440 450 460 470 480 490
540 550 560 570 580 590
pF1KE5 SEPGEPPPASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRR
.. .: .. ::::::::::::: ..::: ::: ...::::
CCDS46 TDASESHHSTNRRRRSRRRRTDEDAVLMDGMTESDTASVNENGLGKRCD
500 510 520 530
600 610 620 630 640 650
pF1KE5 NRGNRTDGSISGDRQPVTVADYISRAESQSRQRPPLERTKPSEDSLSGQKGDSVSKLPKG
>>CCDS3238.1 FXR1 gene_id:8087|Hs108|chr3 (621 aa)
initn: 2377 init1: 1985 opt: 2010 Z-score: 1243.0 bits: 240.3 E(32554): 6.4e-63
Smith-Waterman score: 2424; 59.7% identity (75.2% similar) in 690 aa overlap (14-673:4-621)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
: ::::::::::::::.:::::::.:. :::::: :::.::..::::
CCDS32 MAELTVEVRGSNGAFYKGFIKDVHEDSLTVVFENNWQPERQVPFNEVRLP
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
:: : .:::.::::::::::::.:::::::::.::::::.::::::::::::::::::.:
CCDS32 PPPDIKKEISEGDEVEVYSRANDQEPCGWWLAKVRMMKGEFYVIEYAACDATYNEIVTFE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
:::::: : . :..::: :. :::::::::.:::.::.::::.:: :: . ...:.:
CCDS32 RLRPVNQNKTVKKNTFFKCTVDVPEDLREACANENAHKDFKKAVGACRIFYHPETTQLMI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
::..:: :::...:.:::.::.::::.::::::::::::: .:::::::.:::.::::::
CCDS32 LSASEATVKRVNILSDMHLRSIRTKLMLMSRNEEATKHLECTKQLAAAFHEEFVVREDLM
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
::::::::.:::::::::::::::: :.: :::::::. .: ..::..::: :: .::::
CCDS32 GLAIGTHGSNIQQARKVPGVTAIELDEDTGTFRIYGESADAVKKARGFLEFVEDFIQVPR
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL
:::::::::::::::::::::::::::.::::..: :::.:::::.::::.:.:.:.:.:
CCDS32 NLVGKVIGKNGKVIQEIVDKSGVVRVRIEGDNENKLPREDGMVPFVFVGTKESIGNVQVL
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH
::::..::.::::::.:::::::::::::
CCDS32 LEYHIAYLKEVEQLRMERLQIDEQLRQIG-------------------------------
360 370
430 440 450 460 470
pF1KE5 ATRTYGGSYGGRGRGRRTGGP----AYGPSSDVSTASETESEKREEPNR---AGPGDRDP
.: ::.::::::: :: .:: .:..:. ::::::...: . :: :::
CCDS32 -SR----SYSGRGRGRR--GPNYTSGYGTNSELSNPSETESERKDELSDWSLAGEDDRDS
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE5 PTRGEESRRRPTGGRGRGPPPA-PRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVD
. ..::::: :::::. . : : ..:::::::::::::::::::..: . .:
CCDS32 -RHQRDSRRRP-GGRGRSVSGGRGRGGPRGGKSSISSVLKDPDSNPYSLLDNTESDQTAD
440 450 460 470 480 490
540 550 560 570 580 590
pF1KE5 SEPGEPPPASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRR
.. .: .. ::::::::::::: ..::: ::: ...::::
CCDS32 TDASESHHSTNRRRRSRRRRTDEDAVLMDGMTESDTASVNENGL----------------
500 510 520 530
600 610 620 630
pF1KE5 NRGNRTDGSISGDRQPVTVADYISRAESQSRQR--P--PLERTK------------PSED
::::::::::::::::: : : ..: :::
CCDS32 ----------------VTVADYISRAESQSRQRNLPRETLAKNKKEMAKDVIEEHGPSEK
540 550 560 570
640 650 660 670
pF1KE5 SLSGQ---KGDSVSKLPKGPSE---NGELSAPLELGSMVNGVS
...: .::..::: . :.: : . ....::::
CCDS32 AINGPTSASGDDISKLQRTPGEEKINTLKEENTQEAAVLNGVS
580 590 600 610 620
>>CCDS55518.1 FMR1 gene_id:2332|Hs108|chrX (537 aa)
initn: 1759 init1: 1602 opt: 1604 Z-score: 996.2 bits: 194.4 E(32554): 3.6e-49
Smith-Waterman score: 1604; 71.6% identity (88.2% similar) in 331 aa overlap (14-344:4-334)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
: ::::::::::::.:::::::::.:. :::::: .::::: :::.:
CCDS55 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.:
CCDS55 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: :
CCDS55 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
:: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: ::::::
CCDS55 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
:::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .::::
CCDS55 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL
::::::::::::.::::::::::::::.:..:.:. :.:: ..:
CCDS55 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH
CCDS55 EEKKHLDIKENSTHFSQPNSTKVQRVLVASSVVAGESQKPELKAWQGMVPFVFVGTKDSI
360 370 380 390 400 410
>>CCDS76039.1 FMR1 gene_id:2332|Hs108|chrX (586 aa)
initn: 1681 init1: 1602 opt: 1604 Z-score: 995.7 bits: 194.4 E(32554): 3.9e-49
Smith-Waterman score: 1853; 59.4% identity (75.2% similar) in 524 aa overlap (14-491:4-501)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
: ::::::::::::.:::::::::.:. :::::: .::::: :::.:
CCDS76 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.:
CCDS76 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: :
CCDS76 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
:: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: ::::::
CCDS76 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
:::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .::::
CCDS76 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR
240 250 260 270 280 290
310 320 330 340
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREE--------------------
::::::::::::.::::::::::::::.:..:.:. :.::
CCDS76 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP
300 310 320 330 340 350
350 360 370
pF1KE5 -------------------------GMVPFIFVGTRENISNAQALLEYHLSYLQEVEQLR
:::::.::::...:.:: .::.:::.::.::.:::
CCDS76 EEKKHLDIKENSTHFSQPNSTKVQRGMVPFVFVGTKDSIANATVLLDYHLNYLKEVDQLR
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE5 LERLQIDEQLRQIGLGFRPPGSGRGSGGSDKA-GYSTDESSSSSLHATRTYGGSYGGRGR
:::::::::::::: . ::: . .:: .: ::.... . ...: : . ::.
CCDS76 LERLQIDEQLRQIGASSRPP-----PNRTDKEKSYVTDDGQGMG-RGSRPYRN----RGH
420 430 440 450 460
440 450 460 470 480 490
pF1KE5 GRRTGGPAYGPSSDVSTASETESEKREEPNRAGPGDRDPPTRGEESRRRPTGGRGRGPPP
::: ::.: :.. :: :.:: : : : : :: .: . ::::::
CCDS76 GRR--GPGY-------TSAPTE-EERESFLRRGDGRR----RGGGGRGQ--GGRGRGGGF
470 480 490 500
500 510 520 530 540 550
pF1KE5 APRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPPASARRRRSRRRRTD
CCDS76 KGNDDHSRTDNRPRNPREAKGRTTDGSLQIRVDCNNERSVHTKTLQNTSSEGSRLRTGKD
510 520 530 540 550 560
>>CCDS55519.1 FMR1 gene_id:2332|Hs108|chrX (611 aa)
initn: 1787 init1: 1602 opt: 1604 Z-score: 995.5 bits: 194.4 E(32554): 4e-49
Smith-Waterman score: 1903; 59.1% identity (76.5% similar) in 528 aa overlap (14-491:4-521)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
: ::::::::::::.:::::::::.:. :::::: .::::: :::.:
CCDS55 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.:
CCDS55 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: :
CCDS55 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
:: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: ::::::
CCDS55 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
:::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .::::
CCDS55 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR
240 250 260 270 280 290
310 320 330 340
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREE--------------------
::::::::::::.::::::::::::::.:..:.:. :.::
CCDS55 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP
300 310 320 330 340 350
350 360 370
pF1KE5 -------------------------GMVPFIFVGTRENISNAQALLEYHLSYLQEVEQLR
:::::.::::...:.:: .::.:::.::.::.:::
CCDS55 EEKKHLDIKENSTHFSQPNSTKVQRGMVPFVFVGTKDSIANATVLLDYHLNYLKEVDQLR
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE5 LERLQIDEQLRQIGLGFRPPGSGRGSGGSDKA-GYSTDESSSSSLHATRTYGGSYGGRGR
:::::::::::::: . ::: . .:: .: ::.... . ...: : . ::.
CCDS55 LERLQIDEQLRQIGASSRPP-----PNRTDKEKSYVTDDGQGMG-RGSRPYRN----RGH
420 430 440 450 460
440 450 460 470 480 490
pF1KE5 GRRTGGPAYGPSSDVSTASETESEKREEPN--RAGPGD--RDPPTRGEESRRRPTGGRGR
::: : . : .:..:.::::::..:.: . .: . :. : ..::: ::::.
CCDS55 GRRGPGYTSGTNSEASNASETESDHRDELSDWSLAPTEEERESFLRRGDGRRRGGGGRGQ
470 480 490 500 510 520
500 510 520 530 540 550
pF1KE5 GPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPPASARRRRSRR
:
CCDS55 GGRGRGGGFKGNDDHSRTDNRPRNPREAKGRTTDGSLQIRVDCNNERSVHTKTLQNTSSE
530 540 550 560 570 580
>>CCDS14682.1 FMR1 gene_id:2332|Hs108|chrX (632 aa)
initn: 1789 init1: 1604 opt: 1604 Z-score: 995.3 bits: 194.4 E(32554): 4.1e-49
Smith-Waterman score: 1861; 56.8% identity (73.6% similar) in 549 aa overlap (14-491:4-542)
10 20 30 40 50 60
pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP
: ::::::::::::.:::::::::.:. :::::: .::::: :::.:
CCDS14 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE
::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.:
CCDS14 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI
::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: :
CCDS14 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM
:: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: ::::::
CCDS14 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR
:::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .::::
CCDS14 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR
240 250 260 270 280 290
310 320 330 340
pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREE--------------------
::::::::::::.::::::::::::::.:..:.:. :.::
CCDS14 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP
300 310 320 330 340 350
350
pF1KE5 ----------------------------------------------GMVPFIFVGTRENI
:::::.::::...:
CCDS14 EEKKHLDIKENSTHFSQPNSTKVQRVLVASSVVAGESQKPELKAWQGMVPFVFVGTKDSI
360 370 380 390 400 410
360 370 380 390 400 410
pF1KE5 SNAQALLEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKA-GYSTDE
.:: .::.:::.::.::.::::::::::::::::: . ::: . .:: .: ::.
CCDS14 ANATVLLDYHLNYLKEVDQLRLERLQIDEQLRQIGASSRPP-----PNRTDKEKSYVTDD
420 430 440 450 460
420 430 440 450 460 470
pF1KE5 SSSSSLHATRTYGGSYGGRGRGRRTGGPAYGPSSDVSTASETESEKREEPN--RAGPGD-
... . ...: : . ::.::: : . : .:..:.::::::..:.: . .: .
CCDS14 GQGMG-RGSRPYRN----RGHGRRGPGYTSGTNSEASNASETESDHRDELSDWSLAPTEE
470 480 490 500 510 520
480 490 500 510 520
pF1KE5 -RDPPTRGEESRRRPTGGRGRGPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEP
:. : ..::: ::::.:
CCDS14 ERESFLRRGDGRRRGGGGRGQGGRGRGGGFKGNDDHSRTDNRPRNPREAKGRTTDGSLQI
530 540 550 560 570 580
>>CCDS33894.1 FXR1 gene_id:8087|Hs108|chr3 (536 aa)
initn: 1876 init1: 1484 opt: 1509 Z-score: 938.3 bits: 183.7 E(32554): 6.1e-46
Smith-Waterman score: 1923; 56.7% identity (72.7% similar) in 608 aa overlap (96-673:1-536)
70 80 90 100 110 120
pF1KE5 NKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLERLRPV
::::.::::::::::::::::::.::::::
CCDS33 MMKGEFYVIEYAACDATYNEIVTFERLRPV
10 20 30
130 140 150 160 170 180
pF1KE5 NPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFILSTTE
: : . :..::: :. :::::::::.:::.::.::::.:: :: . ...:.:::..:
CCDS33 NQNKTVKKNTFFKCTVDVPEDLREACANENAHKDFKKAVGACRIFYHPETTQLMILSASE
40 50 60 70 80 90
190 200 210 220 230 240
pF1KE5 APVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLMGLAIG
: :::...:.:::.::.::::.::::::::::::: .:::::::.:::.:::::::::::
CCDS33 ATVKRVNILSDMHLRSIRTKLMLMSRNEEATKHLECTKQLAAAFHEEFVVREDLMGLAIG
100 110 120 130 140 150
250 260 270 280 290 300
pF1KE5 THGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPRNLVGK
:::.:::::::::::::::: :.: :::::::. .: ..::..::: :: .:::::::::
CCDS33 THGSNIQQARKVPGVTAIELDEDTGTFRIYGESADAVKKARGFLEFVEDFIQVPRNLVGK
160 170 180 190 200 210
310 320 330 340 350 360
pF1KE5 VIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQALLEYHL
::::::::::::::::::::::.::::..: :::.:::::.::::.:.:.:.:.:::::.
CCDS33 VIGKNGKVIQEIVDKSGVVRVRIEGDNENKLPREDGMVPFVFVGTKESIGNVQVLLEYHI
220 230 240 250 260 270
370 380 390 400 410 420
pF1KE5 SYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLHATRTY
.::.::::::.::::::::::::: .:
CCDS33 AYLKEVEQLRMERLQIDEQLRQIG--------------------------------SR--
280 290
430 440 450 460 470
pF1KE5 GGSYGGRGRGRRTGGP----AYGPSSDVSTASETESEKREEPNR---AGPGDRDPPTRGE
::.::::::: :: .:: .:..:. ::::::...: . :: ::: . .
CCDS33 --SYSGRGRGRR--GPNYTSGYGTNSELSNPSETESERKDELSDWSLAGEDDRDS-RHQR
300 310 320 330 340 350
480 490 500 510 520 530
pF1KE5 ESRRRPTGGRGRGPPPA-PRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGE
.::::: :::::. . : : ..:::::::::::::::::::..: . .:.. .:
CCDS33 DSRRRP-GGRGRSVSGGRGRGGPRGGKSSISSVLKDPDSNPYSLLDNTESDQTADTDASE
360 370 380 390 400 410
540 550 560 570 580 590
pF1KE5 PPPASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRRNRGNR
.. ::::::::::::: ..::: ::: ...::::
CCDS33 SHHSTNRRRRSRRRRTDEDAVLMDGMTESDTASVNENGL---------------------
420 430 440
600 610 620 630 640
pF1KE5 TDGSISGDRQPVTVADYISRAESQSRQR--P--PLERTK------------PSEDSLSGQ
::::::::::::::::: : : ..: ::: ...:
CCDS33 -----------VTVADYISRAESQSRQRNLPRETLAKNKKEMAKDVIEEHGPSEKAINGP
450 460 470 480 490
650 660 670
pF1KE5 ---KGDSVSKLPKGPSE---NGELSAPLELGSMVNGVS
.::..::: . :.: : . ....::::
CCDS33 TSASGDDISKLQRTPGEEKINTLKEENTQEAAVLNGVS
500 510 520 530
673 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 05:00:30 2016 done: Tue Nov 8 05:00:31 2016
Total Scan time: 4.250 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]