FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5749, 673 aa 1>>>pF1KE5749 673 - 673 aa - 673 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.8487+/-0.000983; mu= 1.0036+/- 0.060 mean_var=268.7052+/-55.296, 0's: 0 Z-trim(114.3): 13 B-trim: 158 in 1/52 Lambda= 0.078241 statistics sampled from 14880 (14893) to 14880 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.757), E-opt: 0.2 (0.457), width: 16 Scan time: 4.250 The best scores are: opt bits E(32554) CCDS45604.1 FXR2 gene_id:9513|Hs108|chr17 ( 673) 4489 520.1 4e-147 CCDS46965.1 FXR1 gene_id:8087|Hs108|chr3 ( 539) 2010 240.2 5.8e-63 CCDS3238.1 FXR1 gene_id:8087|Hs108|chr3 ( 621) 2010 240.3 6.4e-63 CCDS55518.1 FMR1 gene_id:2332|Hs108|chrX ( 537) 1604 194.4 3.6e-49 CCDS76039.1 FMR1 gene_id:2332|Hs108|chrX ( 586) 1604 194.4 3.9e-49 CCDS55519.1 FMR1 gene_id:2332|Hs108|chrX ( 611) 1604 194.4 4e-49 CCDS14682.1 FMR1 gene_id:2332|Hs108|chrX ( 632) 1604 194.4 4.1e-49 CCDS33894.1 FXR1 gene_id:8087|Hs108|chr3 ( 536) 1509 183.7 6.1e-46 >>CCDS45604.1 FXR2 gene_id:9513|Hs108|chr17 (673 aa) initn: 4489 init1: 4489 opt: 4489 Z-score: 2754.9 bits: 520.1 E(32554): 4e-147 Smith-Waterman score: 4489; 100.0% identity (100.0% similar) in 673 aa overlap (1-673:1-673) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 ATRTYGGSYGGRGRGRRTGGPAYGPSSDVSTASETESEKREEPNRAGPGDRDPPTRGEES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ATRTYGGSYGGRGRGRRTGGPAYGPSSDVSTASETESEKREEPNRAGPGDRDPPTRGEES 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 RRRPTGGRGRGPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RRRPTGGRGRGPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 ASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRRNRGNRTDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRRNRGNRTDG 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 SISGDRQPVTVADYISRAESQSRQRPPLERTKPSEDSLSGQKGDSVSKLPKGPSENGELS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SISGDRQPVTVADYISRAESQSRQRPPLERTKPSEDSLSGQKGDSVSKLPKGPSENGELS 610 620 630 640 650 660 670 pF1KE5 APLELGSMVNGVS ::::::::::::: CCDS45 APLELGSMVNGVS 670 >>CCDS46965.1 FXR1 gene_id:8087|Hs108|chr3 (539 aa) initn: 2289 init1: 1985 opt: 2010 Z-score: 1243.9 bits: 240.2 E(32554): 5.8e-63 Smith-Waterman score: 2364; 65.8% identity (82.0% similar) in 571 aa overlap (14-576:4-534) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP : ::::::::::::::.:::::::.:. :::::: :::.::..:::: CCDS46 MAELTVEVRGSNGAFYKGFIKDVHEDSLTVVFENNWQPERQVPFNEVRLP 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE :: : .:::.::::::::::::.:::::::::.::::::.::::::::::::::::::.: CCDS46 PPPDIKKEISEGDEVEVYSRANDQEPCGWWLAKVRMMKGEFYVIEYAACDATYNEIVTFE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI :::::: : . :..::: :. :::::::::.:::.::.::::.:: :: . ...:.: CCDS46 RLRPVNQNKTVKKNTFFKCTVDVPEDLREACANENAHKDFKKAVGACRIFYHPETTQLMI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM ::..:: :::...:.:::.::.::::.::::::::::::: .:::::::.:::.:::::: CCDS46 LSASEATVKRVNILSDMHLRSIRTKLMLMSRNEEATKHLECTKQLAAAFHEEFVVREDLM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR ::::::::.:::::::::::::::: :.: :::::::. .: ..::..::: :: .:::: CCDS46 GLAIGTHGSNIQQARKVPGVTAIELDEDTGTFRIYGESADAVKKARGFLEFVEDFIQVPR 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL :::::::::::::::::::::::::::.::::..: :::.:::::.::::.:.:.:.:.: CCDS46 NLVGKVIGKNGKVIQEIVDKSGVVRVRIEGDNENKLPREDGMVPFVFVGTKESIGNVQVL 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH ::::..::.::::::.::::::::::::: CCDS46 LEYHIAYLKEVEQLRMERLQIDEQLRQIG------------------------------- 360 370 430 440 450 460 470 pF1KE5 ATRTYGGSYGGRGRGRRTGGP----AYGPSSDVSTASETESEKREEPNR---AGPGDRDP .: ::.::::::: :: .:: .:..:. ::::::...: . :: ::: CCDS46 -SR----SYSGRGRGRR--GPNYTSGYGTNSELSNPSETESERKDELSDWSLAGEDDRDS 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE5 PTRGEESRRRPTGGRGRGPPPA-PRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVD . ..::::: :::::. . : : ..:::::::::::::::::::..: . .: CCDS46 -RHQRDSRRRP-GGRGRSVSGGRGRGGPRGGKSSISSVLKDPDSNPYSLLDNTESDQTAD 440 450 460 470 480 490 540 550 560 570 580 590 pF1KE5 SEPGEPPPASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRR .. .: .. ::::::::::::: ..::: ::: ...:::: CCDS46 TDASESHHSTNRRRRSRRRRTDEDAVLMDGMTESDTASVNENGLGKRCD 500 510 520 530 600 610 620 630 640 650 pF1KE5 NRGNRTDGSISGDRQPVTVADYISRAESQSRQRPPLERTKPSEDSLSGQKGDSVSKLPKG >>CCDS3238.1 FXR1 gene_id:8087|Hs108|chr3 (621 aa) initn: 2377 init1: 1985 opt: 2010 Z-score: 1243.0 bits: 240.3 E(32554): 6.4e-63 Smith-Waterman score: 2424; 59.7% identity (75.2% similar) in 690 aa overlap (14-673:4-621) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP : ::::::::::::::.:::::::.:. :::::: :::.::..:::: CCDS32 MAELTVEVRGSNGAFYKGFIKDVHEDSLTVVFENNWQPERQVPFNEVRLP 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE :: : .:::.::::::::::::.:::::::::.::::::.::::::::::::::::::.: CCDS32 PPPDIKKEISEGDEVEVYSRANDQEPCGWWLAKVRMMKGEFYVIEYAACDATYNEIVTFE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI :::::: : . :..::: :. :::::::::.:::.::.::::.:: :: . ...:.: CCDS32 RLRPVNQNKTVKKNTFFKCTVDVPEDLREACANENAHKDFKKAVGACRIFYHPETTQLMI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM ::..:: :::...:.:::.::.::::.::::::::::::: .:::::::.:::.:::::: CCDS32 LSASEATVKRVNILSDMHLRSIRTKLMLMSRNEEATKHLECTKQLAAAFHEEFVVREDLM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR ::::::::.:::::::::::::::: :.: :::::::. .: ..::..::: :: .:::: CCDS32 GLAIGTHGSNIQQARKVPGVTAIELDEDTGTFRIYGESADAVKKARGFLEFVEDFIQVPR 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL :::::::::::::::::::::::::::.::::..: :::.:::::.::::.:.:.:.:.: CCDS32 NLVGKVIGKNGKVIQEIVDKSGVVRVRIEGDNENKLPREDGMVPFVFVGTKESIGNVQVL 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH ::::..::.::::::.::::::::::::: CCDS32 LEYHIAYLKEVEQLRMERLQIDEQLRQIG------------------------------- 360 370 430 440 450 460 470 pF1KE5 ATRTYGGSYGGRGRGRRTGGP----AYGPSSDVSTASETESEKREEPNR---AGPGDRDP .: ::.::::::: :: .:: .:..:. ::::::...: . :: ::: CCDS32 -SR----SYSGRGRGRR--GPNYTSGYGTNSELSNPSETESERKDELSDWSLAGEDDRDS 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE5 PTRGEESRRRPTGGRGRGPPPA-PRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVD . ..::::: :::::. . : : ..:::::::::::::::::::..: . .: CCDS32 -RHQRDSRRRP-GGRGRSVSGGRGRGGPRGGKSSISSVLKDPDSNPYSLLDNTESDQTAD 440 450 460 470 480 490 540 550 560 570 580 590 pF1KE5 SEPGEPPPASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRR .. .: .. ::::::::::::: ..::: ::: ...:::: CCDS32 TDASESHHSTNRRRRSRRRRTDEDAVLMDGMTESDTASVNENGL---------------- 500 510 520 530 600 610 620 630 pF1KE5 NRGNRTDGSISGDRQPVTVADYISRAESQSRQR--P--PLERTK------------PSED ::::::::::::::::: : : ..: ::: CCDS32 ----------------VTVADYISRAESQSRQRNLPRETLAKNKKEMAKDVIEEHGPSEK 540 550 560 570 640 650 660 670 pF1KE5 SLSGQ---KGDSVSKLPKGPSE---NGELSAPLELGSMVNGVS ...: .::..::: . :.: : . ....:::: CCDS32 AINGPTSASGDDISKLQRTPGEEKINTLKEENTQEAAVLNGVS 580 590 600 610 620 >>CCDS55518.1 FMR1 gene_id:2332|Hs108|chrX (537 aa) initn: 1759 init1: 1602 opt: 1604 Z-score: 996.2 bits: 194.4 E(32554): 3.6e-49 Smith-Waterman score: 1604; 71.6% identity (88.2% similar) in 331 aa overlap (14-344:4-334) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP : ::::::::::::.:::::::::.:. :::::: .::::: :::.: CCDS55 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE ::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.: CCDS55 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI ::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: : CCDS55 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM :: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: :::::: CCDS55 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR :::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .:::: CCDS55 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQAL ::::::::::::.::::::::::::::.:..:.:. :.:: ..: CCDS55 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 LEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLH CCDS55 EEKKHLDIKENSTHFSQPNSTKVQRVLVASSVVAGESQKPELKAWQGMVPFVFVGTKDSI 360 370 380 390 400 410 >>CCDS76039.1 FMR1 gene_id:2332|Hs108|chrX (586 aa) initn: 1681 init1: 1602 opt: 1604 Z-score: 995.7 bits: 194.4 E(32554): 3.9e-49 Smith-Waterman score: 1853; 59.4% identity (75.2% similar) in 524 aa overlap (14-491:4-501) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP : ::::::::::::.:::::::::.:. :::::: .::::: :::.: CCDS76 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE ::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.: CCDS76 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI ::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: : CCDS76 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM :: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: :::::: CCDS76 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR :::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .:::: CCDS76 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR 240 250 260 270 280 290 310 320 330 340 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREE-------------------- ::::::::::::.::::::::::::::.:..:.:. :.:: CCDS76 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP 300 310 320 330 340 350 350 360 370 pF1KE5 -------------------------GMVPFIFVGTRENISNAQALLEYHLSYLQEVEQLR :::::.::::...:.:: .::.:::.::.::.::: CCDS76 EEKKHLDIKENSTHFSQPNSTKVQRGMVPFVFVGTKDSIANATVLLDYHLNYLKEVDQLR 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE5 LERLQIDEQLRQIGLGFRPPGSGRGSGGSDKA-GYSTDESSSSSLHATRTYGGSYGGRGR :::::::::::::: . ::: . .:: .: ::.... . ...: : . ::. CCDS76 LERLQIDEQLRQIGASSRPP-----PNRTDKEKSYVTDDGQGMG-RGSRPYRN----RGH 420 430 440 450 460 440 450 460 470 480 490 pF1KE5 GRRTGGPAYGPSSDVSTASETESEKREEPNRAGPGDRDPPTRGEESRRRPTGGRGRGPPP ::: ::.: :.. :: :.:: : : : : :: .: . :::::: CCDS76 GRR--GPGY-------TSAPTE-EERESFLRRGDGRR----RGGGGRGQ--GGRGRGGGF 470 480 490 500 500 510 520 530 540 550 pF1KE5 APRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPPASARRRRSRRRRTD CCDS76 KGNDDHSRTDNRPRNPREAKGRTTDGSLQIRVDCNNERSVHTKTLQNTSSEGSRLRTGKD 510 520 530 540 550 560 >>CCDS55519.1 FMR1 gene_id:2332|Hs108|chrX (611 aa) initn: 1787 init1: 1602 opt: 1604 Z-score: 995.5 bits: 194.4 E(32554): 4e-49 Smith-Waterman score: 1903; 59.1% identity (76.5% similar) in 528 aa overlap (14-491:4-521) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP : ::::::::::::.:::::::::.:. :::::: .::::: :::.: CCDS55 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE ::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.: CCDS55 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI ::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: : CCDS55 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM :: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: :::::: CCDS55 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR :::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .:::: CCDS55 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR 240 250 260 270 280 290 310 320 330 340 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREE-------------------- ::::::::::::.::::::::::::::.:..:.:. :.:: CCDS55 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP 300 310 320 330 340 350 350 360 370 pF1KE5 -------------------------GMVPFIFVGTRENISNAQALLEYHLSYLQEVEQLR :::::.::::...:.:: .::.:::.::.::.::: CCDS55 EEKKHLDIKENSTHFSQPNSTKVQRGMVPFVFVGTKDSIANATVLLDYHLNYLKEVDQLR 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE5 LERLQIDEQLRQIGLGFRPPGSGRGSGGSDKA-GYSTDESSSSSLHATRTYGGSYGGRGR :::::::::::::: . ::: . .:: .: ::.... . ...: : . ::. CCDS55 LERLQIDEQLRQIGASSRPP-----PNRTDKEKSYVTDDGQGMG-RGSRPYRN----RGH 420 430 440 450 460 440 450 460 470 480 490 pF1KE5 GRRTGGPAYGPSSDVSTASETESEKREEPN--RAGPGD--RDPPTRGEESRRRPTGGRGR ::: : . : .:..:.::::::..:.: . .: . :. : ..::: ::::. CCDS55 GRRGPGYTSGTNSEASNASETESDHRDELSDWSLAPTEEERESFLRRGDGRRRGGGGRGQ 470 480 490 500 510 520 500 510 520 530 540 550 pF1KE5 GPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGEPPPASARRRRSRR : CCDS55 GGRGRGGGFKGNDDHSRTDNRPRNPREAKGRTTDGSLQIRVDCNNERSVHTKTLQNTSSE 530 540 550 560 570 580 >>CCDS14682.1 FMR1 gene_id:2332|Hs108|chrX (632 aa) initn: 1789 init1: 1604 opt: 1604 Z-score: 995.3 bits: 194.4 E(32554): 4.1e-49 Smith-Waterman score: 1861; 56.8% identity (73.6% similar) in 549 aa overlap (14-491:4-542) 10 20 30 40 50 60 pF1KE5 MGGLASGGDVEPGLPVEVRGSNGAFYKGFVKDVHEDSVTIFFENNWQSERQIPFGDVRLP : ::::::::::::.:::::::::.:. :::::: .::::: :::.: CCDS14 MEELVVEVRGSNGAFYKAFVKDVHEDSITVAFENNWQPDRQIPFHDVRFP 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 PPADYNKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLE ::. :::.:.:.:::::::::::.::: ::::.:::.::.::::::::::::::::::.: CCDS14 PPVGYNKDINESDEVEVYSRANEKEPCCWWLAKVRMIKGEFYVIEYAACDATYNEIVTIE 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 RLRPVNPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFI ::: :::: ::: .: :. . ::::::. :..: .::.::::.:: . . : .: : CCDS14 RLRSVNPNKPATKDTFHKIKLDVPEDLRQMCAKEAAHKDFKKAVGAFSVTYDPENYQLVI 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 LSTTEAPVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLM :: .:. ::: .: ::::::::::: :. :::::.:.::.:.:::. :.:.: :::::: CCDS14 LSINEVTSKRAHMLIDMHFRSLRTKLSLIMRNEEASKQLESSRQLASRFHEQFIVREDLM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 GLAIGTHGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPR :::::::::::::::::::::::.: :.::::.:::: .: ..:::.:::.:: .:::: CCDS14 GLAIGTHGANIQQARKVPGVTAIDLDEDTCTFHIYGEDQDAVKKARSFLEFAEDVIQVPR 240 250 260 270 280 290 310 320 330 340 pF1KE5 NLVGKVIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREE-------------------- ::::::::::::.::::::::::::::.:..:.:. :.:: CCDS14 NLVGKVIGKNGKLIQEIVDKSGVVRVRIEAENEKNVPQEEEIMPPNSLPSNNSRVGPNAP 300 310 320 330 340 350 350 pF1KE5 ----------------------------------------------GMVPFIFVGTRENI :::::.::::...: CCDS14 EEKKHLDIKENSTHFSQPNSTKVQRVLVASSVVAGESQKPELKAWQGMVPFVFVGTKDSI 360 370 380 390 400 410 360 370 380 390 400 410 pF1KE5 SNAQALLEYHLSYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKA-GYSTDE .:: .::.:::.::.::.::::::::::::::::: . ::: . .:: .: ::. CCDS14 ANATVLLDYHLNYLKEVDQLRLERLQIDEQLRQIGASSRPP-----PNRTDKEKSYVTDD 420 430 440 450 460 420 430 440 450 460 470 pF1KE5 SSSSSLHATRTYGGSYGGRGRGRRTGGPAYGPSSDVSTASETESEKREEPN--RAGPGD- ... . ...: : . ::.::: : . : .:..:.::::::..:.: . .: . CCDS14 GQGMG-RGSRPYRN----RGHGRRGPGYTSGTNSEASNASETESDHRDELSDWSLAPTEE 470 480 490 500 510 520 480 490 500 510 520 pF1KE5 -RDPPTRGEESRRRPTGGRGRGPPPAPRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEP :. : ..::: ::::.: CCDS14 ERESFLRRGDGRRRGGGGRGQGGRGRGGGFKGNDDHSRTDNRPRNPREAKGRTTDGSLQI 530 540 550 560 570 580 >>CCDS33894.1 FXR1 gene_id:8087|Hs108|chr3 (536 aa) initn: 1876 init1: 1484 opt: 1509 Z-score: 938.3 bits: 183.7 E(32554): 6.1e-46 Smith-Waterman score: 1923; 56.7% identity (72.7% similar) in 608 aa overlap (96-673:1-536) 70 80 90 100 110 120 pF1KE5 NKEITEGDEVEVYSRANEQEPCGWWLARVRMMKGDFYVIEYAACDATYNEIVTLERLRPV ::::.::::::::::::::::::.:::::: CCDS33 MMKGEFYVIEYAACDATYNEIVTFERLRPV 10 20 30 130 140 150 160 170 180 pF1KE5 NPNPLATKGSFFKVTMAVPEDLREACSNENVHKEFKKALGANCIFLNITNSELFILSTTE : : . :..::: :. :::::::::.:::.::.::::.:: :: . ...:.:::..: CCDS33 NQNKTVKKNTFFKCTVDVPEDLREACANENAHKDFKKAVGACRIFYHPETTQLMILSASE 40 50 60 70 80 90 190 200 210 220 230 240 pF1KE5 APVKRASLLGDMHFRSLRTKLLLMSRNEEATKHLETSKQLAAAFQEEFTVREDLMGLAIG : :::...:.:::.::.::::.::::::::::::: .:::::::.:::.::::::::::: CCDS33 ATVKRVNILSDMHLRSIRTKLMLMSRNEEATKHLECTKQLAAAFHEEFVVREDLMGLAIG 100 110 120 130 140 150 250 260 270 280 290 300 pF1KE5 THGANIQQARKVPGVTAIELGEETCTFRIYGETPEACRQARSYLEFSEDSVQVPRNLVGK :::.:::::::::::::::: :.: :::::::. .: ..::..::: :: .::::::::: CCDS33 THGSNIQQARKVPGVTAIELDEDTGTFRIYGESADAVKKARGFLEFVEDFIQVPRNLVGK 160 170 180 190 200 210 310 320 330 340 350 360 pF1KE5 VIGKNGKVIQEIVDKSGVVRVRVEGDNDKKNPREEGMVPFIFVGTRENISNAQALLEYHL ::::::::::::::::::::::.::::..: :::.:::::.::::.:.:.:.:.:::::. CCDS33 VIGKNGKVIQEIVDKSGVVRVRIEGDNENKLPREDGMVPFVFVGTKESIGNVQVLLEYHI 220 230 240 250 260 270 370 380 390 400 410 420 pF1KE5 SYLQEVEQLRLERLQIDEQLRQIGLGFRPPGSGRGSGGSDKAGYSTDESSSSSLHATRTY .::.::::::.::::::::::::: .: CCDS33 AYLKEVEQLRMERLQIDEQLRQIG--------------------------------SR-- 280 290 430 440 450 460 470 pF1KE5 GGSYGGRGRGRRTGGP----AYGPSSDVSTASETESEKREEPNR---AGPGDRDPPTRGE ::.::::::: :: .:: .:..:. ::::::...: . :: ::: . . CCDS33 --SYSGRGRGRR--GPNYTSGYGTNSELSNPSETESERKDELSDWSLAGEDDRDS-RHQR 300 310 320 330 340 350 480 490 500 510 520 530 pF1KE5 ESRRRPTGGRGRGPPPA-PRPTSRYNSSSISSVLKDPDSNPYSLLDTSEPEPPVDSEPGE .::::: :::::. . : : ..:::::::::::::::::::..: . .:.. .: CCDS33 DSRRRP-GGRGRSVSGGRGRGGPRGGKSSISSVLKDPDSNPYSLLDNTESDQTADTDASE 360 370 380 390 400 410 540 550 560 570 580 590 pF1KE5 PPPASARRRRSRRRRTDEDRTVMDGGLESDGPNMTENGLEDESRPQRRNRSRRRRNRGNR .. ::::::::::::: ..::: ::: ...:::: CCDS33 SHHSTNRRRRSRRRRTDEDAVLMDGMTESDTASVNENGL--------------------- 420 430 440 600 610 620 630 640 pF1KE5 TDGSISGDRQPVTVADYISRAESQSRQR--P--PLERTK------------PSEDSLSGQ ::::::::::::::::: : : ..: ::: ...: CCDS33 -----------VTVADYISRAESQSRQRNLPRETLAKNKKEMAKDVIEEHGPSEKAINGP 450 460 470 480 490 650 660 670 pF1KE5 ---KGDSVSKLPKGPSE---NGELSAPLELGSMVNGVS .::..::: . :.: : . ....:::: CCDS33 TSASGDDISKLQRTPGEEKINTLKEENTQEAAVLNGVS 500 510 520 530 673 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:00:30 2016 done: Tue Nov 8 05:00:31 2016 Total Scan time: 4.250 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]