FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9394, 1163 aa 1>>>pF1KE9394 1163 - 1163 aa - 1163 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.7095+/-0.00115; mu= -10.9735+/- 0.069 mean_var=393.7285+/-80.704, 0's: 0 Z-trim(114.0): 65 B-trim: 60 in 1/52 Lambda= 0.064636 statistics sampled from 14510 (14562) to 14510 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.736), E-opt: 0.2 (0.447), width: 16 Scan time: 6.370 The best scores are: opt bits E(32554) CCDS4164.1 AFF4 gene_id:27125|Hs108|chr5 (1163) 7646 728.0 3.1e-209 CCDS54775.1 AFF1 gene_id:4299|Hs108|chr4 (1218) 1581 162.5 5.7e-39 CCDS3616.1 AFF1 gene_id:4299|Hs108|chr4 (1210) 1579 162.3 6.5e-39 CCDS42723.1 AFF3 gene_id:3899|Hs108|chr2 (1226) 1138 121.2 1.6e-26 CCDS33258.1 AFF3 gene_id:3899|Hs108|chr2 (1251) 1138 121.2 1.6e-26 CCDS78510.1 AFF2 gene_id:2334|Hs108|chrX (1276) 1013 109.5 5.2e-23 CCDS55521.1 AFF2 gene_id:2334|Hs108|chrX ( 952) 999 108.1 1e-22 CCDS76040.1 AFF2 gene_id:2334|Hs108|chrX (1276) 999 108.2 1.3e-22 CCDS14684.1 AFF2 gene_id:2334|Hs108|chrX (1311) 999 108.2 1.3e-22 >>CCDS4164.1 AFF4 gene_id:27125|Hs108|chr5 (1163 aa) initn: 7646 init1: 7646 opt: 7646 Z-score: 3869.9 bits: 728.0 E(32554): 3.1e-209 Smith-Waterman score: 7646; 100.0% identity (100.0% similar) in 1163 aa overlap (1-1163:1-1163) 10 20 30 40 50 60 pF1KE9 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVTSKEDKLSSRIQSMLGNYD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVTSKEDKLSSRIQSMLGNYD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 EMKDFIGDRSIPKLVAIPKPTVPPSADEKSNPNFFEQRHGGSHQSSKWTPVGPAPSTSQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EMKDFIGDRSIPKLVAIPKPTVPPSADEKSNPNFFEQRHGGSHQSSKWTPVGPAPSTSQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 QKRSSGLQSGHSSQRTSAGSSSGTNSSGQRHDRESYNNSGSSSRKKGQHGSEHSKSRSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QKRSSGLQSGHSSQRTSAGSSSGTNSSGQRHDRESYNNSGSSSRKKGQHGSEHSKSRSSS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 PGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKSPRDPDANWDSPSRVPFSSGQHSTQSFPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKSPRDPDANWDSPSRVPFSSGQHSTQSFPP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 SLMSKSNSMLQKPTAYVRPMDGQESMEPKLSSEHYSSQSHGNSMTELKPSSKAHLTKLKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SLMSKSNSMLQKPTAYVRPMDGQESMEPKLSSEHYSSQSHGNSMTELKPSSKAHLTKLKI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 PSQPLDASASGDVSCVDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PSQPLDASASGDVSCVDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 EQKRYNPSKTSNGHQSKSMLKDDLKLSSSEDSDGEQDCDKTMPRSTPGSNSEPSHHNSEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EQKRYNPSKTSNGHQSKSMLKDDLKLSSSEDSDGEQDCDKTMPRSTPGSNSEPSHHNSEG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 ADNSRDDSSSHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ADNSRDDSSSHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 VNPHKVSPASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPKETSSATPGRDSKTIQKGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VNPHKVSPASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPKETSSATPGRDSKTIQKGS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 ESGRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEEPRGGLKIESETPVDLASSMPSSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ESGRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEEPRGGLKIESETPVDLASSMPSSR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 HKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREIIETDTSSSDSDESESLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 HKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREIIETDTSSSDSDESESLP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 PSSQTPKYPESNRTPVKPSSVEEEDSFFRQRMFSPMEEKELLSPLSEPDDRYPLIVKIDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PSSQTPKYPESNRTPVKPSSVEEEDSFFRQRMFSPMEEKELLSPLSEPDDRYPLIVKIDL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 NLLTRIPGKPYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHKNEDDNRASESK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NLLTRIPGKPYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHKNEDDNRASESK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 KPKTEDKNSAGHKPSSNRESSKQSAAKEKDLLPSPAGPVPSKDPKTEHGSRKRTISQSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 KPKTEDKNSAGHKPSSNRESSKQSAAKEKDLLPSPAGPVPSKDPKTEHGSRKRTISQSSS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 LKSSSNSNKETSGSSKNSSSTSKQKKTEGKTSSSSKEVKEKAPSSSSNCPPSAPTLDSSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LKSSSNSNKETSGSSKNSSSTSKQKKTEGKTSSSSKEVKEKAPSSSSNCPPSAPTLDSSK 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 PRRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECGNALEKNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 PRRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECGNALEKNA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 QESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRLFKLKKEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRLFKLKKEN 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 ALKYSKTLTEHLKNSYNNSQAPSPGLGSKAVGMPSPVSPKLSPGNSGNYSSGASSASASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ALKYSKTLTEHLKNSYNNSQAPSPGLGSKAVGMPSPVSPKLSPGNSGNYSSGASSASASG 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 SSVTIPQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKVMGPLIFNASI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SSVTIPQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKVMGPLIFNASI 1090 1100 1110 1120 1130 1140 1150 1160 pF1KE9 MTDLVRYTRQGLHWLRQDAKLIS ::::::::::::::::::::::: CCDS41 MTDLVRYTRQGLHWLRQDAKLIS 1150 1160 >>CCDS54775.1 AFF1 gene_id:4299|Hs108|chr4 (1218 aa) initn: 1393 init1: 451 opt: 1581 Z-score: 813.1 bits: 162.5 E(32554): 5.7e-39 Smith-Waterman score: 2437; 39.7% identity (68.0% similar) in 1222 aa overlap (12-1160:25-1216) 10 20 30 40 pF1KE9 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVTSKEDK .:.:::::: .: ..::: . :::.:::: :.: :. CCDS54 MAFTERVNSSGNSLYNDDRNLLRIREKERRNQEAHQEKEAFPEKIPLFGEPYK-TAKGDE 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 LSSRIQSMLGNYDEMKDFIGDRS-IPKLVA----IPKPTVPPSADEKSN-PNFFEQRHGG ::::::.:::::.:.:.:.. .: .: : . :: : :. :. :. . : . CCDS54 LSSRIQNMLGNYEEVKEFLSTKSHTHRLDASENRLGKPKYPLIPDKGSSIPS--SSFHTS 60 70 80 90 100 110 110 120 130 140 150 pF1KE9 SHQSSKWTPV-GP------APSTSQSQKRSSGLQSGHSSQRTSAGSSSGTNSSGQRHDRE :..: ::. :: . . ...: :. . : : : : . .:. .:: CCDS54 VHHQSIHTPASGPLSVGNISHNPKMAQPRTEPMPSLH------AKSCGPPDSQHLTQDRL 120 130 140 150 160 170 160 170 180 190 pF1KE9 SYNNSGSSSRKKGQH--GSEHSKSRS-SSPGK--------PQAVSSLNSSHS-------- . .. ::: .:::.. ..: : . :.: . :. : :. :: CCDS54 GQEGFGSSHHKKGDRRADGDHCASVTDSAPERELSPLISLPSPVPPLSPIHSNQQTLPRT 180 190 200 210 220 230 200 210 220 230 240 pF1KE9 ----RSHGNDHHSKEHQRSKSPRDPDA---NWDSPSRVPFSSGQHSTQSFPP-SLMSKSN . ::....:: . .:::.: . . ..:. . .: .:.::: :: ::: CCDS54 QGSSKVHGSSNNSKGYCPAKSPKDLAVKVHDKETPQDSLVAPAQPPSQTFPPPSLPSKSV 240 250 260 270 280 290 250 260 270 280 290 300 pF1KE9 SMLQKPTAYVRPMDGQE---SMEPKLSS--EHYSSQSHGNSMTELKPSSKAHLTKLKIPS .: :::::::::::::. : :.:. : : .:. . :.:: .::.:::::.:: CCDS54 AMQQKPTAYVRPMDGQDQAPSESPELKPLPEDYRQQTFEK--TDLKVPAKAKLTKLKMPS 300 310 320 330 340 310 320 330 340 350 360 pF1KE9 QPLDASASGDVSCVDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQ : .. . :..: ::.:::::::::::::::::::: .::::::::::.::. . : .: CCDS54 QSVEQTYSNEVHCVEEILKEMTHSWPPPLTAIHTPSTAEPSKFPFPTKDSQHVSSVTQNQ 350 360 370 380 390 400 370 380 390 400 410 pF1KE9 KRYNPS-KT-SNGHQ-SKSMLKDDLKLSSSEDSDGEQDCDKTMPRSTPGSNSEPSHHNS- :.:. : :: ::..: ..:::.:::.::.:::::.:: :.. :.:.. :: .: CCDS54 KQYDTSSKTHSNSQQGTSSMLEDDLQLSDSEDSDSEQT-----PEKPPSSSAPPSAPQSL 410 420 430 440 450 460 420 430 440 450 460 470 pF1KE9 -EGADNSRDDSS-SHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDN : . .....:. :.: :.:.:.::::::::::::: ::: .. .:::::: :::::::: CCDS54 PEPVASAHSSSAESESTSDSDSSSDSESESSSSDSEENEPLETPAPEPEPPTTNKWQLDN 470 480 490 500 510 520 480 490 500 510 520 530 pF1KE9 WLNKVNPHKVSPASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPK-ETSSATPGRDSKT ::.::. . : . ... : . .: . ...:.. ..... : ..:: .: .. CCDS54 WLTKVSQPAAPPEGPRSTEPPRRHPESKGSSDSATSQEHSESKDPPPKSSSKAPRAPPEA 530 540 550 560 570 580 540 550 560 570 580 590 pF1KE9 IQKGSESGRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEE-PRGGLKIESET---PVD . :. :. ::::::.. ::.::: ::::: ::.:. : .:. : : : CCDS54 PHPGK---RSCQKSPAQQEPP-QRQTVGTKQPKKPVKASARAGSRTSLQGEREPGLLPYG 590 600 610 620 630 640 600 610 620 630 640 pF1KE9 LASSMPSSRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREIIET--DTS .. ... :. ::: . ..: : . :..::::.::. . .:. : :. CCDS54 SRDQTSKDKPKVKTKGRPRAAASNEPKPAVPPSSEKKKHKSSLPAPSKALSGPEPAKDNV 650 660 670 680 690 700 650 660 670 680 690 700 pF1KE9 SSDSDESESLPPSSQTPKYPES---NRTP-VKPSSVEEEDSFFRQRMFSPMEEKELLSPL . . : .: : ... :.: .:: . . : .::: ..:. :... .::::: CCDS54 EDRTPEHFALVPLTESQGPPHSGSGSRTSGCRQAVVVQEDSR-KDRLPLPLRDTKLLSPL 710 720 730 740 750 710 720 730 740 750 760 pF1KE9 SEPDDRYPLIVKIDLNLLTRIPGKPYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGK . :.::: :.::.::: : : .. :.: :. : . . ..:..:.. :.: CCDS54 RDTPPPQSLMVKITLDLLSRIPQPPGKGSRQRKAEDKQPPAGKKHSSEKRSSDS-SSKLA 760 770 780 790 800 810 770 780 790 800 810 pF1KE9 RKHKNEDDNRASESKKPKTED--KNSAGHKPSSNRESSK------QSAAKEKDLLPSPAG .:.:.: . : ..:: . : :.... . ::..:::: .: ...:..:: : CCDS54 KKRKGEAE-RDCDNKKIRLEKEIKSQSSSSSSSHKESSKTKPSRPSSQSSKKEMLPPP-- 820 830 840 850 860 870 820 830 840 850 860 870 pF1KE9 PVPSKDPKTEHGSRKRTISQSSSLKSSSNSNKETSGSSKNSSSTSKQKKTEGKTSSSSKE :: :.. : . . ::. .... .. .. .. :....:: ::...::: : ::.: CCDS54 PVSSSSQKPAKPALKRSRREADTCGQDPPKSASSTKSNHKDSSIPKQRRVEGKGSRSSSE 880 890 900 910 920 930 880 890 900 910 920 930 pF1KE9 VKEKAPSSSSNCP-PSAPTLDSSKPRRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRF : .. .... : :: :. .::: . .. :: .. :: ...::::.:..:. ..:: CCDS54 HKGSSGDTANPFPVPSLPN-GNSKPGKPQVKFDKQQ--ADLHMREAKKMKQKAELMTDRV 940 950 960 970 980 990 940 950 960 970 980 990 pF1KE9 EKAVYYLDAVVSFIECGNALEKNAQESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADK :: ::.::.:::::: : :...: ::: . .:::::::::. :.::.. : . .: CCDS54 GKAFKYLEAVLSFIECGIATESESQSSKSAYSVYSETVDLIKFIMSLKSFSDATAPTQEK 1000 1010 1020 1030 1040 1050 1000 1010 1020 1030 1040 1050 pF1KE9 RLTVLCLRCESLLYLRLFKLKKENALKYSKTLTEHLKNSYNNSQAPSPGLGSKAVGMPSP ..:::.::.:.: . .:. ::. :.:::.::..:...: . .::::: . ....: ::: CCDS54 IFAVLCMRCQSILNMAMFRCKKDIAIKYSRTLNKHFESSSKVAQAPSPCI-ARSTGTPSP 1060 1070 1080 1090 1100 1110 1060 1070 1080 1090 1100 1110 pF1KE9 VSPKLSPGNSGNYSSGASSASASGSSVTI--PQKIHQMAASYVQVTSNFLYATEIWDQAE .:: ::..: . .:.:.:...:: ..:: : :..:..::: .::. : : ..:.::: CCDS54 LSPMPSPASSVGSQSSAGSVGSSGVAATISTPVTIQNMTSSYVTITSHVLTAFDLWEQAE 1120 1130 1140 1150 1160 1170 1120 1130 1140 1150 1160 pF1KE9 QLSKEQKEFFAELDKVMGPLIFNASIMTDLVRYTRQGLHWLRQDAKLIS :....:::::.:. . : .:.: ..:::.:::::.. :.. .: CCDS54 ALTRKNKEFFARLSTNVCTLALNSS-LVDLVHYTRQGFQQLQELTKTP 1180 1190 1200 1210 >>CCDS3616.1 AFF1 gene_id:4299|Hs108|chr4 (1210 aa) initn: 1547 init1: 605 opt: 1579 Z-score: 812.1 bits: 162.3 E(32554): 6.5e-39 Smith-Waterman score: 2435; 39.8% identity (67.9% similar) in 1222 aa overlap (12-1160:18-1208) 10 20 30 40 50 pF1KE9 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVTSKEDKLSSRIQS .:.:::::: .: ..::: . :::.:::: :.: :.::::::. CCDS36 MAAQSSLYNDDRNLLRIREKERRNQEAHQEKEAFPEKIPLFGEPYK-TAKGDELSSRIQN 10 20 30 40 50 60 70 80 90 100 pF1KE9 MLGNYDEMKDFIGDRS-IPKLVA----IPKPTVPPSADEKSN-PNFFEQRHGGSHQSSKW :::::.:.:.:.. .: .: : . :: : :. :. :. . : . :..: CCDS36 MLGNYEEVKEFLSTKSHTHRLDASENRLGKPKYPLIPDKGSSIPS--SSFHTSVHHQSIH 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 TPV-GP------APSTSQSQKRSSGLQSGHSSQRTSAGSSSGTNSSGQRHDRESYNNSGS ::. :: . . ...: :. . : : : : . .:. .:: . .. :: CCDS36 TPASGPLSVGNISHNPKMAQPRTEPMPSLH------AKSCGPPDSQHLTQDRLGQEGFGS 120 130 140 150 160 170 170 180 190 pF1KE9 SSRKKGQH--GSEHSKSRS-SSPGK--------PQAVSSLNSSHS------------RSH : .:::.. ..: : . :.: . :. : :. :: . : CCDS36 SHHKKGDRRADGDHCASVTDSAPERELSPLISLPSPVPPLSPIHSNQQTLPRTQGSSKVH 180 190 200 210 220 230 200 210 220 230 240 250 pF1KE9 GNDHHSKEHQRSKSPRDPDA---NWDSPSRVPFSSGQHSTQSFPP-SLMSKSNSMLQKPT :....:: . .:::.: . . ..:. . .: .:.::: :: ::: .: :::: CCDS36 GSSNNSKGYCPAKSPKDLAVKVHDKETPQDSLVAPAQPPSQTFPPPSLPSKSVAMQQKPT 240 250 260 270 280 290 260 270 280 290 300 pF1KE9 AYVRPMDGQE---SMEPKLSS--EHYSSQSHGNSMTELKPSSKAHLTKLKIPSQPLDASA :::::::::. : :.:. : : .:. . :.:: .::.:::::.::: .. . CCDS36 AYVRPMDGQDQAPSESPELKPLPEDYRQQTFEK--TDLKVPAKAKLTKLKMPSQSVEQTY 300 310 320 330 340 310 320 330 340 350 360 pF1KE9 SGDVSCVDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQKRYNPS- :..: ::.:::::::::::::::::::: .::::::::::.::. . : .::.:. : CCDS36 SNEVHCVEEILKEMTHSWPPPLTAIHTPSTAEPSKFPFPTKDSQHVSSVTQNQKQYDTSS 350 360 370 380 390 400 370 380 390 400 410 420 pF1KE9 KT-SNGHQ-SKSMLKDDLKLSSSEDSDGEQDCDKTMPRSTPGSNSEPSHHNS--EGADNS :: ::..: ..:::.:::.::.:::::.:: :.. :.:.. :: .: : . .. CCDS36 KTHSNSQQGTSSMLEDDLQLSDSEDSDSEQT-----PEKPPSSSAPPSAPQSLPEPVASA 410 420 430 440 450 460 430 440 450 460 470 480 pF1KE9 RDDSS-SHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNKVNP ...:. :.: :.:.:.::::::::::::: ::: .. .:::::: ::::::::::.::. CCDS36 HSSSAESESTSDSDSSSDSESESSSSDSEENEPLETPAPEPEPPTTNKWQLDNWLTKVSQ 470 480 490 500 510 520 490 500 510 520 530 540 pF1KE9 HKVSPASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPK-ETSSATPGRDSKTIQKGSES . : . ... : . .: . ...:.. ..... : ..:: .: .. . :. CCDS36 PAAPPEGPRSTEPPRRHPESKGSSDSATSQEHSESKDPPPKSSSKAPRAPPEAPHPGK-- 530 540 550 560 570 580 550 560 570 580 590 pF1KE9 GRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEE-PRGGLKIESET---PVDLASSMPS :. ::::::.. ::.::: ::::: ::.:. : .:. : : : .. . CCDS36 -RSCQKSPAQQEPP-QRQTVGTKQPKKPVKASARAGSRTSLQGEREPGLLPYGSRDQTSK 590 600 610 620 630 640 600 610 620 630 640 650 pF1KE9 SRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREIIET--DTSSSDSDES .. :. ::: . ..: : . :..::::.::. . .:. : :. . . : CCDS36 DKPKVKTKGRPRAAASNEPKPAVPPSSEKKKHKSSLPAPSKALSGPEPAKDNVEDRTPEH 650 660 670 680 690 700 660 670 680 690 700 710 pF1KE9 ESLPPSSQTPKYPES---NRTP-VKPSSVEEEDSFFRQRMFSPMEEKELLSPLSEPDDRY .: : ... :.: .:: . . : .::: ..:. :... .::::: . CCDS36 FALVPLTESQGPPHSGSGSRTSGCRQAVVVQEDSR-KDRLPLPLRDTKLLSPLRDTPPPQ 710 720 730 740 750 720 730 740 750 760 770 pF1KE9 PLIVKIDLNLLTRIPGKPYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHKNED :.::: :.::.::: : : .. :.: :. : . . ..:..:.. :.: .:.:.: CCDS36 SLMVKITLDLLSRIPQPPGKGSRQRKAEDKQPPAGKKHSSEKRSSDS-SSKLAKKRKGEA 760 770 780 790 800 810 780 790 800 810 820 pF1KE9 DNRASESKKPKTED--KNSAGHKPSSNRESSK------QSAAKEKDLLPSPAGPVPSKDP . : ..:: . : :.... . ::..:::: .: ...:..:: : :: :.. CCDS36 E-RDCDNKKIRLEKEIKSQSSSSSSSHKESSKTKPSRPSSQSSKKEMLPPP--PVSSSSQ 820 830 840 850 860 870 830 840 850 860 870 880 pF1KE9 KTEHGSRKRTISQSSSLKSSSNSNKETSGSSKNSSSTSKQKKTEGKTSSSSKEVKEKAPS : . . ::. .... .. .. .. :....:: ::...::: : ::.: : .. . CCDS36 KPAKPALKRSRREADTCGQDPPKSASSTKSNHKDSSIPKQRRVEGKGSRSSSEHKGSSGD 880 890 900 910 920 930 890 900 910 920 930 940 pF1KE9 SSSNCP-PSAPTLDSSKPRRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYYL ... : :: :. .::: . .. :: .. :: ...::::.:..:. ..:: :: :: CCDS36 TANPFPVPSLPN-GNSKPGKPQVKFDKQQ--ADLHMREAKKMKQKAELMTDRVGKAFKYL 940 950 960 970 980 990 950 960 970 980 990 1000 pF1KE9 DAVVSFIECGNALEKNAQESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLCL .::.:::::: : :...: ::: . .:::::::::. :.::.. : . .: ..:::. CCDS36 EAVLSFIECGIATESESQSSKSAYSVYSETVDLIKFIMSLKSFSDATAPTQEKIFAVLCM 1000 1010 1020 1030 1040 1050 1010 1020 1030 1040 1050 1060 pF1KE9 RCESLLYLRLFKLKKENALKYSKTLTEHLKNSYNNSQAPSPGLGSKAVGMPSPVSPKLSP ::.:.: . .:. ::. :.:::.::..:...: . .::::: ..: .: :::.:: :: CCDS36 RCQSILNMAMFRCKKDIAIKYSRTLNKHFESSSKVAQAPSPCIAS--TGTPSPLSPMPSP 1060 1070 1080 1090 1100 1110 1070 1080 1090 1100 1110 1120 pF1KE9 GNSGNYSSGASSASASGSSVTI--PQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQK ..: . .:.:.:...:: ..:: : :..:..::: .::. : : ..:.::: :....: CCDS36 ASSVGSQSSAGSVGSSGVAATISTPVTIQNMTSSYVTITSHVLTAFDLWEQAEALTRKNK 1120 1130 1140 1150 1160 1170 1130 1140 1150 1160 pF1KE9 EFFAELDKVMGPLIFNASIMTDLVRYTRQGLHWLRQDAKLIS ::::.:. . : .:.: ..:::.:::::.. :.. .: CCDS36 EFFARLSTNVCTLALNSS-LVDLVHYTRQGFQQLQELTKTP 1180 1190 1200 1210 >>CCDS42723.1 AFF3 gene_id:3899|Hs108|chr2 (1226 aa) initn: 1566 init1: 573 opt: 1138 Z-score: 589.8 bits: 121.2 E(32554): 1.6e-26 Smith-Waterman score: 2213; 37.5% identity (63.8% similar) in 1261 aa overlap (13-1161:31-1225) 10 20 30 40 pF1KE9 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVT :::::::: :: . .: : ::.:::: : CCDS42 MDSFDLALLQEWDLESLCVYEPDRNALRRKERERRNQETQQDDGTFNSSYSLFSEPYK-T 10 20 30 40 50 50 60 70 80 90 100 pF1KE9 SKEDKLSSRIQSMLGNYDEMKDFIGDRSIPK-LVAIPKPTVPPSADEKSNPNFFEQRHGG .: :.::.:::. ::::::::::. ::: . ::..::: :: . .: . .: CCDS42 NKGDELSNRIQNTLGNYDEMKDFLTDRSNQSHLVGVPKPGVPQTPVNKIDEHFV------ 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 SHQSSKWTPVGPAPSTSQSQKRSSGLQSGHSSQRTSAGSSSGTNSSGQRHDRESYNNSGS : : .:.: : :. .:. . :. : :. CCDS42 ------------ADSRAQNQPSSI----------CSTTTSTPAAVPVQQSKR------GT 120 130 140 170 180 190 200 210 220 pF1KE9 SSRKKGQHGSEHSKSRSSSPGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKSPRDPDANWD . .:. : ...:... : :: :. .: .... :.:. . ... . CCDS42 MGWQKAGHPPSDGQQRATQQG------SL-----RTLLGDGVGRQQPRAKQVCNVEVGLQ 150 160 170 180 190 230 240 250 260 270 pF1KE9 SPSRVP-----FSSGQHSTQSFPPSLMSKSNSMLQKPTAYVRPMDGQESME---PKLSSE . : : ::. : .:.::::: :: . . :::::::::::::.. :::.: CCDS42 TQERPPAMAAKHSSSGHCVQNFPPSLASKPSLVQQKPTAYVRPMDGQDQAPDESPKLKSS 200 210 220 230 240 250 280 290 300 310 320 pF1KE9 HYSS----QSHGNSMTELKPS-SKAHLTKLKIPSQPLDASASGDV-SCVDEILKEMTHSW .: . .: .. .:. .::.:.:..::.: . : ::.. :::.::..::: : CCDS42 SETSVHCTSYRGVPASKPEPARAKAKLSKFSIPKQG-EESRSGETNSCVEEIIREMT--W 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE9 PPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQKRYN--PSKTSNGHQSKSMLKDDLK :::.::..: :.::.:::::.:.:: . : .. :. . : . .:: .. :::.:::: CCDS42 LPPLSAIQAPGKVEPTKFPFPNKDSQLVSSGHNNPKKGDAEPESPDNGTSNTSMLEDDLK 320 330 340 350 360 370 390 400 410 420 430 pF1KE9 LSSSEDSDGEQDCDKTMPRSTPGS------NSEPSHHNSEGADNSRDD--SSSHSGSESS :::.:. . .: ..: :. : : . : .:.:...: .. ::: : :::: CCDS42 LSSDEEENEQQAAQRTALRALSDSAVVQQPNCRTSVPSSKGSSSSSSSGSSSSSSDSESS 380 390 400 410 420 430 440 450 460 470 480 490 pF1KE9 SGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNKVNPHKVSPASSVDSNIP ::::::.:::::.::...: . .::: :: .::::::.::::::::: . .:. CCDS42 SGSDSETESSSSESEGSKPPHFSSPEAEPASSNKWQLDKWLNKVNPHKPPILIQNESHGS 440 450 460 470 480 490 500 510 520 530 540 550 pF1KE9 SSQGYKKEGRE--QGTGNSYTDTSGP----KETSSATPGRDSKTIQKGSESGRG-RQKSP :. : . .: : :. :. : :: .:. .. . . ...: .:::: CCDS42 ESNQYYNPVKEDVQDCGK-VPDVCQPSLREKEIKSTCKEEQRPRTANKAPGSKGVKQKSP 500 510 520 530 540 550 560 570 580 pF1KE9 ---------------------AQSDSTTQRRTVGKKQPKKAEKAAAEEPRGGLKIESETP :.. . ::..::: ...:...: . . . : . CCDS42 PAAVAVAVSAAAPPPAVPCAPAENAPAPARRSAGKKPTRRTERTSAGDGANCHRPEEPAA 560 570 580 590 600 610 590 600 610 620 630 640 pF1KE9 VD-LASSM--PSSRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREIIET .: :..:. : :. :. . . .:: .:: : ::.. .. :. ::.:.::: CCDS42 ADALGTSVVVPPEPTKTRPCGNNRASHRKELRSSV--TCEKRRTRGLSRIVPKSKEFIET 620 630 640 650 660 650 660 670 pF1KE9 DTSSS----DSD---ESESLPPSS-------------QTPKYPESN-----RTPV----- ..::: ::: :.: : :. : : .: :.:: CCDS42 ESSSSSSSSDSDLESEQEEYPLSKAQTVAASASSGNDQRLKEAAANGGSGPRAPVGSINA 670 680 690 700 710 720 680 690 700 710 720 pF1KE9 -KPSSV--EEEDSFFRQRMFSPMEEKELLSPLSEPDDRYPLIVKIDLNLLTRIP----GK :.. : :..:. . :. ..::::::.. :. : :::::.::.::: . CCDS42 RTTSDIAKELEEQFYT---LVPFGRNELLSPLKDSDEIRSLWVKIDLTLLSRIPEHLPQE 730 740 750 760 770 780 730 740 750 760 770 780 pF1KE9 PYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHK--NEDDNRASESKKPKTE-D : . : .....: .:: .. .::. :.:::.: :::: : : :: . : : CCDS42 PGVLSAPATKDSESAPPSHTSDTP---AEKALPKSKRKRKCDNEDDYR--EIKKSQGEKD 790 800 810 820 830 840 790 800 810 820 830 pF1KE9 KNSAGHKPSSNRESSKQ------SAA----KEKDLLPSPAGPVPSKDPKTEHGSRKRTIS ..: .:: :... :.: :.. .: :: .:. . ..: .. .. CCDS42 SSSRLATSTSNTLSANHCNMNINSVAIPINKNEKMLRSPISPL---SDASKHKYTSEDLT 850 860 870 880 890 840 850 860 870 880 890 pF1KE9 QSSSLKSSSNSNKETSGSSKNSSSTSKQKKTEGKTSSSSKEVKEKAP--SSSSNCPPSAP .:: . ..:: ...:::. .. :. . : ...... .:. : .: . : .: CCDS42 SSS--RPNGNSLFTSASSSKKPKADSQLQPHGGDLTKAAHNNSENIPLHKSRPQTKPWSP 900 910 920 930 940 950 900 910 920 930 940 950 pF1KE9 TLDSSKP-RRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECG .. . .: :::::: :::...::::..::.:::. ..: ::. : .:..:::::: CCDS42 GSNGHRDCKRQKLVFDDMPRSADYFMQEAKRMKHKADAMVEKFGKALNYAEAALSFIECG 960 970 980 990 1000 1010 960 970 980 990 1000 1010 pF1KE9 NALEKNAQESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRL ::.:.. .:::::. ::::::.::.:.:.::.. .:.:: ::.:..:: :: .::: :. CCDS42 NAMEQGPMESKSPYTMYSETVELIRYAMRLKTHSGPNATPEDKQLAALCYRCLALLYWRM 1020 1030 1040 1050 1060 1070 1020 1030 1040 1050 1060 1070 pF1KE9 FKLKKENALKYSKTLTEHLKNSYNNSQAPSP-GLGSKAVGMPSPVSPKLSPGNSGNYSSG :.::...:.::::.: ...::: . .::::: : ..:..: :::.::. ::..: . ... CCDS42 FRLKRDHAVKYSKALIDYFKNSSKAAQAPSPWGASGKSTGTPSPMSPNPSPASSVGSQGS 1080 1090 1100 1110 1120 1130 1080 1090 1100 1110 1120 1130 pF1KE9 ASSASASGSS--VTIPQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKV :.::: . : :.:::.::::::..:..:...:.. . :..:..:.::..::: .:: . CCDS42 LSNASALSPSTIVSIPQRIHQMAANHVSITNSILHSYDYWEMADNLAKENREFFNDLDLL 1140 1150 1160 1170 1180 1190 1140 1150 1160 pF1KE9 MGPLIFNASIMTDLVRYTRQGLHWLRQDAKLIS :::. ...: : ::.:..:::::::..:.: CCDS42 MGPVTLHSS-MEHLVQYSQQGLHWLRNSAHLS 1200 1210 1220 >>CCDS33258.1 AFF3 gene_id:3899|Hs108|chr2 (1251 aa) initn: 1566 init1: 573 opt: 1138 Z-score: 589.6 bits: 121.2 E(32554): 1.6e-26 Smith-Waterman score: 2213; 37.5% identity (63.8% similar) in 1261 aa overlap (13-1161:56-1250) 10 20 30 40 pF1KE9 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVT :::::::: :: . .: : ::.:::: : CCDS33 RNDSLVVEFQSSASRCRSVYEPDRNALRRKERERRNQETQQDDGTFNSSYSLFSEPYK-T 30 40 50 60 70 80 50 60 70 80 90 100 pF1KE9 SKEDKLSSRIQSMLGNYDEMKDFIGDRSIPK-LVAIPKPTVPPSADEKSNPNFFEQRHGG .: :.::.:::. ::::::::::. ::: . ::..::: :: . .: . .: CCDS33 NKGDELSNRIQNTLGNYDEMKDFLTDRSNQSHLVGVPKPGVPQTPVNKIDEHFV------ 90 100 110 120 130 110 120 130 140 150 160 pF1KE9 SHQSSKWTPVGPAPSTSQSQKRSSGLQSGHSSQRTSAGSSSGTNSSGQRHDRESYNNSGS : : .:.: : :. .:. . :. : :. CCDS33 ------------ADSRAQNQPSSI----------CSTTTSTPAAVPVQQSKR------GT 140 150 160 170 170 180 190 200 210 220 pF1KE9 SSRKKGQHGSEHSKSRSSSPGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKSPRDPDANWD . .:. : ...:... : :: :. .: .... :.:. . ... . CCDS33 MGWQKAGHPPSDGQQRATQQG------SL-----RTLLGDGVGRQQPRAKQVCNVEVGLQ 180 190 200 210 230 240 250 260 270 pF1KE9 SPSRVP-----FSSGQHSTQSFPPSLMSKSNSMLQKPTAYVRPMDGQESME---PKLSSE . : : ::. : .:.::::: :: . . :::::::::::::.. :::.: CCDS33 TQERPPAMAAKHSSSGHCVQNFPPSLASKPSLVQQKPTAYVRPMDGQDQAPDESPKLKSS 220 230 240 250 260 270 280 290 300 310 320 pF1KE9 HYSS----QSHGNSMTELKPS-SKAHLTKLKIPSQPLDASASGDV-SCVDEILKEMTHSW .: . .: .. .:. .::.:.:..::.: . : ::.. :::.::..::: : CCDS33 SETSVHCTSYRGVPASKPEPARAKAKLSKFSIPKQG-EESRSGETNSCVEEIIREMT--W 280 290 300 310 320 330 330 340 350 360 370 380 pF1KE9 PPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQKRYN--PSKTSNGHQSKSMLKDDLK :::.::..: :.::.:::::.:.:: . : .. :. . : . .:: .. :::.:::: CCDS33 LPPLSAIQAPGKVEPTKFPFPNKDSQLVSSGHNNPKKGDAEPESPDNGTSNTSMLEDDLK 340 350 360 370 380 390 390 400 410 420 430 pF1KE9 LSSSEDSDGEQDCDKTMPRSTPGS------NSEPSHHNSEGADNSRDD--SSSHSGSESS :::.:. . .: ..: :. : : . : .:.:...: .. ::: : :::: CCDS33 LSSDEEENEQQAAQRTALRALSDSAVVQQPNCRTSVPSSKGSSSSSSSGSSSSSSDSESS 400 410 420 430 440 450 440 450 460 470 480 490 pF1KE9 SGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNKVNPHKVSPASSVDSNIP ::::::.:::::.::...: . .::: :: .::::::.::::::::: . .:. CCDS33 SGSDSETESSSSESEGSKPPHFSSPEAEPASSNKWQLDKWLNKVNPHKPPILIQNESHGS 460 470 480 490 500 510 500 510 520 530 540 550 pF1KE9 SSQGYKKEGRE--QGTGNSYTDTSGP----KETSSATPGRDSKTIQKGSESGRG-RQKSP :. : . .: : :. :. : :: .:. .. . . ...: .:::: CCDS33 ESNQYYNPVKEDVQDCGK-VPDVCQPSLREKEIKSTCKEEQRPRTANKAPGSKGVKQKSP 520 530 540 550 560 570 560 570 580 pF1KE9 ---------------------AQSDSTTQRRTVGKKQPKKAEKAAAEEPRGGLKIESETP :.. . ::..::: ...:...: . . . : . CCDS33 PAAVAVAVSAAAPPPAVPCAPAENAPAPARRSAGKKPTRRTERTSAGDGANCHRPEEPAA 580 590 600 610 620 630 590 600 610 620 630 640 pF1KE9 VD-LASSM--PSSRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREIIET .: :..:. : :. :. . . .:: .:: : ::.. .. :. ::.:.::: CCDS33 ADALGTSVVVPPEPTKTRPCGNNRASHRKELRSSV--TCEKRRTRGLSRIVPKSKEFIET 640 650 660 670 680 690 650 660 670 pF1KE9 DTSSS----DSD---ESESLPPSS-------------QTPKYPESN-----RTPV----- ..::: ::: :.: : :. : : .: :.:: CCDS33 ESSSSSSSSDSDLESEQEEYPLSKAQTVAASASSGNDQRLKEAAANGGSGPRAPVGSINA 700 710 720 730 740 750 680 690 700 710 720 pF1KE9 -KPSSV--EEEDSFFRQRMFSPMEEKELLSPLSEPDDRYPLIVKIDLNLLTRIP----GK :.. : :..:. . :. ..::::::.. :. : :::::.::.::: . CCDS33 RTTSDIAKELEEQFYT---LVPFGRNELLSPLKDSDEIRSLWVKIDLTLLSRIPEHLPQE 760 770 780 790 800 810 730 740 750 760 770 780 pF1KE9 PYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHK--NEDDNRASESKKPKTE-D : . : .....: .:: .. .::. :.:::.: :::: : : :: . : : CCDS33 PGVLSAPATKDSESAPPSHTSDTP---AEKALPKSKRKRKCDNEDDYR--EIKKSQGEKD 820 830 840 850 860 790 800 810 820 830 pF1KE9 KNSAGHKPSSNRESSKQ------SAA----KEKDLLPSPAGPVPSKDPKTEHGSRKRTIS ..: .:: :... :.: :.. .: :: .:. . ..: .. .. CCDS33 SSSRLATSTSNTLSANHCNMNINSVAIPINKNEKMLRSPISPL---SDASKHKYTSEDLT 870 880 890 900 910 920 840 850 860 870 880 890 pF1KE9 QSSSLKSSSNSNKETSGSSKNSSSTSKQKKTEGKTSSSSKEVKEKAP--SSSSNCPPSAP .:: . ..:: ...:::. .. :. . : ...... .:. : .: . : .: CCDS33 SSS--RPNGNSLFTSASSSKKPKADSQLQPHGGDLTKAAHNNSENIPLHKSRPQTKPWSP 930 940 950 960 970 980 900 910 920 930 940 950 pF1KE9 TLDSSKP-RRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECG .. . .: :::::: :::...::::..::.:::. ..: ::. : .:..:::::: CCDS33 GSNGHRDCKRQKLVFDDMPRSADYFMQEAKRMKHKADAMVEKFGKALNYAEAALSFIECG 990 1000 1010 1020 1030 1040 960 970 980 990 1000 1010 pF1KE9 NALEKNAQESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRL ::.:.. .:::::. ::::::.::.:.:.::.. .:.:: ::.:..:: :: .::: :. CCDS33 NAMEQGPMESKSPYTMYSETVELIRYAMRLKTHSGPNATPEDKQLAALCYRCLALLYWRM 1050 1060 1070 1080 1090 1100 1020 1030 1040 1050 1060 1070 pF1KE9 FKLKKENALKYSKTLTEHLKNSYNNSQAPSP-GLGSKAVGMPSPVSPKLSPGNSGNYSSG :.::...:.::::.: ...::: . .::::: : ..:..: :::.::. ::..: . ... CCDS33 FRLKRDHAVKYSKALIDYFKNSSKAAQAPSPWGASGKSTGTPSPMSPNPSPASSVGSQGS 1110 1120 1130 1140 1150 1160 1080 1090 1100 1110 1120 1130 pF1KE9 ASSASASGSS--VTIPQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKV :.::: . : :.:::.::::::..:..:...:.. . :..:..:.::..::: .:: . CCDS33 LSNASALSPSTIVSIPQRIHQMAANHVSITNSILHSYDYWEMADNLAKENREFFNDLDLL 1170 1180 1190 1200 1210 1220 1140 1150 1160 pF1KE9 MGPLIFNASIMTDLVRYTRQGLHWLRQDAKLIS :::. ...: : ::.:..:::::::..:.: CCDS33 MGPVTLHSS-MEHLVQYSQQGLHWLRNSAHLS 1230 1240 1250 >>CCDS78510.1 AFF2 gene_id:2334|Hs108|chrX (1276 aa) initn: 1660 init1: 586 opt: 1013 Z-score: 526.5 bits: 109.5 E(32554): 5.2e-23 Smith-Waterman score: 1833; 35.1% identity (59.5% similar) in 1240 aa overlap (75-1162:91-1276) 50 60 70 80 90 100 pF1KE9 EDKLSSRIQSMLGNYDEMKDFIGDRSIPKLVAIPKPTVPPSADEKSNPNFF-EQRHG--G :.::: .:: . ..:..:.:: ::.. CCDS78 DALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKNRIIP 70 80 90 100 110 120 110 120 130 140 150 pF1KE9 SHQSSKWTPVGPAPSTSQSQKRSSGLQSGHSSQ----RTSAGSSS--GTNSSGQRHDRES ::.. : .: : : :. ..:...:. : : . :. ....::: . .. CCDS78 PHQDNT-HPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNKMQT 130 140 150 160 170 160 170 180 190 200 210 pF1KE9 YNNSGSSSRKKG--QHGSEHSKSRSSSPGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKSP ... :... . . .:. . ..: :. ..:. : :.: :: .:.:: CCDS78 LTQDQSQAKLEDFFVYPAEQPQIGEVEESNP---SAKEDSNPNSSGEDAF-KEIFQSNSP 180 190 200 210 220 230 220 230 240 250 260 pF1KE9 RDPDANWDSP-------SRVPFSSGQHSTQSFPPSLMSKSNSMLQKPTAYVRPMDGQES- .. . ..: : . ::: :.:.:::.:. :.. :::::::::::::.. CCDS78 EESEFAVQAPGSPLVASSLLAPSSGL-SVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQA 240 250 260 270 280 290 270 280 290 300 310 pF1KE9 --MEPKLSSEHYSSQSHGN----SMTELKPS---SKAHLTKLKIPSQPLDASASGDVSCV . : :. .: :: .. . ::: ::..: :. : : ..: .: ::: CCDS78 PDISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTI-LQTSEVSLPSDPSCV 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE9 DEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQKRYNPS-KTSNGHQ .:::.: : : : :: .:. ..:. CCDS78 EEILRESQHLTP-----------------------------GFTLQKWNDPTTRASTKSV 360 370 380 380 390 400 410 420 pF1KE9 S-KSMLKDDLKLSSSED--------------SDGEQDCDKTMPRSTPGSNSEPSHHNSEG : ::::.:::::::.:: .. : .:. ::..: : . . CCDS78 SFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNP-VNPPLATPQPPP 390 400 410 420 430 440 430 440 450 460 470 480 pF1KE9 ADNSRDDSSSHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNK : .. :.: : ::::: :::..:::..:::.:: . :.:::::: :::::::.:::: CCDS78 AVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNK 450 460 470 480 490 500 490 500 510 520 530 pF1KE9 VNPHKVS--------PASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPKETSSATPGRD :. .. : : ... : : .. . . . :. . ::: . :. CCDS78 VTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVK--TNASQVPAEPKERPLLSLIRE 510 520 530 540 550 560 540 550 560 570 580 pF1KE9 S---KTIQKGSESGRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEEPRGGLK--IESE . . :: :. ..: . :....:: :.:::::::.:: .. . : : : CCDS78 KARPRPTQKIPETKALKHKLSTTSETVSQR-TIGKKQPKKVEKNTSTDEFTWPKPNITSS 570 580 590 600 610 620 590 600 610 620 630 640 pF1KE9 TPVDLAS----SMPSSRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREI :: . : . : .:.::. ..:: .:: . . . :::::.. .: ::::. CCDS78 TPKEKESVELHDPPRGRNKAT---AHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKSREF 630 640 650 660 670 650 660 670 680 pF1KE9 IETDTSSSDS--DESESL-----PP----SSQTPKYPE------SNRTPVKPSSVEEEDS ::::.:.::: :. :.: :: ...: : : . : .. :. ... : CCDS78 IETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNNNLS 680 690 700 710 720 730 690 700 710 720 730 740 pF1KE9 FFRQR-MFSPME--EKELLSPLSEPDDRYPLIVKIDLNLLTRIPGKPYKETEPPKGEKKN . .. :::. . :.:::: . .. : :::::.::.:.::. .. : : ..:. CCDS78 ISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPDHKE 740 750 760 770 780 790 750 760 770 780 790 pF1KE9 VPEKHTREAQKQASEKVSNKGKRKHKNEDDNRASESKKPKTEDKNSA-----------GH . : :.. : :: . ::::::: . . :: . :. .. : CCDS78 TATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPAPPH 800 810 820 830 840 850 800 810 820 830 840 pF1KE9 KPSSNRESSKQSAA---KEKDLLPSPAGPVPSKDPKTEHGS-------RKRTISQSSSLK :: ..::.... : ::. :.: : .:.: :. .. : . ..:...... CCDS78 KPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTGQIT 860 870 880 890 900 910 850 860 870 880 pF1KE9 SSS------------------NSNKETSGSSKNSSSTSKQKKTEGKTSSSSKEVKEKAPS :.. .. :..:... . ..:. : :. . : : . CCDS78 STKPKRTEGKFCATFKGISEGDTPKKASSATITVTNTAIATATVTATAIVTTTVTATATA 920 930 940 950 960 970 890 900 910 pF1KE9 SSSNCPPSA---------------------------PTLDSSKP--RRTKLVFDDRNYSA .... .. : :.::. :: ::.::: ..: CCDS78 TATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNA 980 990 1000 1010 1020 1030 920 930 940 950 960 970 pF1KE9 DHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECGNALEKNAQESKSPFPMYSETVD :.:.::::::::.:::: ..: ::: : ::..:: :::::.:.. :.:::. ::::::. CCDS78 DYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETVE 1040 1050 1060 1070 1080 1090 980 990 1000 1010 1020 1030 pF1KE9 LIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRLFKLKKENALKYSKTLTEHLK-N :..:.:.:::. .: :. .::.:.::: :: ::::::.:::::..:.:::..: :..: : CCDS78 LLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQN 1100 1110 1120 1130 1140 1150 1040 1050 1060 1070 1080 1090 pF1KE9 SYNNSQAPSPGLGSKAVGMPSPVS-PKLSPGNS-GNYSSGASSASASGSSVTIPQKIHQM . . .: ::: . :.. . ::::: ..:: :. :: ..: :::::.::.: CCDS78 ASKVAQIPSPWV-SNGKNTPSPVSLNNVSPINAMGNCNNGP---------VTIPQRIHHM 1160 1170 1180 1190 1200 1100 1110 1120 1130 1140 1150 pF1KE9 AASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKVMGPLIFNASIMTDLVRYTRQGL :::.:..::: : . : ::.:..:..:.::::..:: .:::: ..: ::.::::.:::: CCDS78 AASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSS-MTNLVRYVRQGL 1210 1220 1230 1240 1250 1260 1160 pF1KE9 HWLRQDAKLIS ::: ::.:. CCDS78 CWLRIDAHLL 1270 >>CCDS55521.1 AFF2 gene_id:2334|Hs108|chrX (952 aa) initn: 1347 init1: 586 opt: 999 Z-score: 521.3 bits: 108.1 E(32554): 1e-22 Smith-Waterman score: 1602; 37.0% identity (61.2% similar) in 964 aa overlap (325-1162:7-952) 300 310 320 330 340 350 pF1KE9 LTKLKIPSQPLDASASGDVSCVDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQ :. : . ... ..:: .:::. CCDS55 MKFKRRHQAFPSFFKMKVSLPSDPSCVEEILRESQH 10 20 30 360 370 380 390 pF1KE9 SNFGTGEQKRYNPS-KTSNGHQS-KSMLKDDLKLSSSED--------------SDGEQDC . : :: .:. ..:. : ::::.:::::::.:: .. : CCDS55 LTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAV 40 50 60 70 80 90 400 410 420 430 440 450 pF1KE9 DKTMPRSTPGSNSEPSHHNSEGADNSRDDSSSHSGSESSSGSDSESESSSSDSEANEPSQ .:. ::..: : . . : .. :.: : ::::: :::..:::..:::.:: . CCDS55 EKAKPRNNP-VNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPR 100 110 120 130 140 150 460 470 480 490 500 510 pF1KE9 SASPEPEPPPTNKWQLDNWLNKVNPHKVS--------PASSVDSNIPSSQGYKKEGREQG :.:::::: :::::::.:::::. .. : : ... : : .. . . . CCDS55 VATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVK- 160 170 180 190 200 210 520 530 540 550 560 pF1KE9 TGNSYTDTSGPKETSSATPGRDS---KTIQKGSESGRGRQKSPAQSDSTTQRRTVGKKQP :. : . . ::: . :.. . :: :. ..: . :....:: :.::::: CCDS55 TNASQVPAE-PKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQR-TIGKKQP 220 230 240 250 260 270 570 580 590 600 610 620 pF1KE9 KKAEKAAAEEPRGGLK--IESETPVDLAS----SMPSSRHKAATKGSRKPNIKKESKSSP ::.:: .. . : : : :: . : . : .:.::. ..:: .:: . . CCDS55 KKVEKNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKAT---AHKPAPRKEPRPNI 280 290 300 310 320 630 640 650 660 670 pF1KE9 RPTAEKKKYKSTSKSSQKSREIIETDTSSSDS--DESESL-----PP----SSQTPKYPE . :::::.. .: ::::.::::.:.::: :. :.: :: ...: : : CCDS55 PLAPEKKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKE 330 340 350 360 370 380 680 690 700 710 720 pF1KE9 ------SNRTPVKPSSVEEEDSFFRQR-MFSPME--EKELLSPLSEPDDRYPLIVKIDLN . : .. :. ... :. .. :::. . :.:::: . .. : :::::. CCDS55 ICGASLTLSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLD 390 400 410 420 430 440 730 740 750 760 770 780 pF1KE9 LLTRIPGKPYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHKNEDDNRASESKK ::.:.::. .. : : ..:.. : :.. : :: . ::::::: . . :: CCDS55 LLSRVPGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKK 450 460 470 480 490 500 790 800 810 820 pF1KE9 PKTEDKNSA-----------GHKPSSNRESSKQSAA---KEKDLLPSPAGPVPSKDPKTE . :. .. ::: ..::.... : ::. :.: : .:.: :. . CCDS55 QRLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRR 510 520 530 540 550 560 830 840 850 860 pF1KE9 HGS-------RKRTISQSSSLKSSSNSNKETS------GSSKNSSSTSKQKK-------- . : . ..:...... :.. . : . : : : ..: :. . CCDS55 NVSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTN 570 580 590 600 610 620 870 880 890 900 pF1KE9 ----------TEGKTSSSSKEVKEKAPSSSSNCPPSAPT-------LDSSK--------- : :.. . . : ..... :. : .:::. CCDS55 TAIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAAL 630 640 650 660 670 680 910 920 930 940 950 pF1KE9 P---------RRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIE : :: ::.::: ..::.:.::::::::.:::: ..: ::: : ::..:: : CCDS55 PLLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTE 690 700 710 720 730 740 960 970 980 990 1000 1010 pF1KE9 CGNALEKNAQESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYL ::::.:.. :.:::. ::::::.:..:.:.:::. .: :. .::.:.::: :: ::::: CCDS55 CGNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYL 750 760 770 780 790 800 1020 1030 1040 1050 1060 pF1KE9 RLFKLKKENALKYSKTLTEHLK-NSYNNSQAPSPGLGSKAVGMPSPVS-PKLSPGNS-GN :.:::::..:.:::..: :..: :. . .: ::: . :.. . ::::: ..:: :. :: CCDS55 RMFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWV-SNGKNTPSPVSLNNVSPINAMGN 810 820 830 840 850 860 1070 1080 1090 1100 1110 1120 pF1KE9 YSSGASSASASGSSVTIPQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELD ..: :::::.::.::::.:..::: : . : ::.:..:..:.::::..:: CCDS55 CNNGP---------VTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLD 870 880 890 900 910 1130 1140 1150 1160 pF1KE9 KVMGPLIFNASIMTDLVRYTRQGLHWLRQDAKLIS .:::: ..: ::.::::.:::: ::: ::.:. CCDS55 TLMGPLTQHSS-MTNLVRYVRQGLCWLRIDAHLL 920 930 940 950 >>CCDS76040.1 AFF2 gene_id:2334|Hs108|chrX (1276 aa) initn: 1601 init1: 586 opt: 999 Z-score: 519.5 bits: 108.2 E(32554): 1.3e-22 Smith-Waterman score: 1826; 35.1% identity (59.1% similar) in 1241 aa overlap (74-1162:94-1276) 50 60 70 80 90 100 pF1KE9 KEDKLSSRIQSMLGNYDEMKDFIGDRSIPKLVAIPKPTVPPSADEKSNPNFF-EQRHG-- ::.::: .:: . ..:..:.:: ::.. CCDS76 GDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKNRII 70 80 90 100 110 120 110 120 130 140 150 pF1KE9 GSHQSSKWTPVGPAPSTSQSQKRSSGLQSGHSSQ----RTSAGSSS--GTNSSGQRHDRE ::.. : .: : : :. ..:...:. : : . :. ....::: . . CCDS76 PPHQDNT-HPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNKMQ 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE9 SYNNSGSSSRKKG--QHGSEHSKSRSSSPGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKS . ... :... . . .:. . ..: :. ..:. : :.: :: .:.: CCDS76 TLTQDQSQAKLEDFFVYPAEQPQIGEVEESNP---SAKEDSNPNSSGEDAF-KEIFQSNS 190 200 210 220 230 220 230 240 250 260 pF1KE9 PRDPDANWDSP-------SRVPFSSGQHSTQSFPPSLMSKSNSMLQKPTAYVRPMDGQES :.. . ..: : . ::: :.:.:::.:. :.. :::::::::::::.. CCDS76 PEESEFAVQAPGSPLVASSLLAPSSGL-SVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQ 240 250 260 270 280 290 270 280 290 300 310 pF1KE9 ---MEPKLSSEHYSSQSHGN----SMTELKPS---SKAHLTKLKIPSQPLDASASGDVSC . : :. .: :: .. . ::: ::..: :. : : ..: .: :: CCDS76 APDISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTI-LQTSEVSLPSDPSC 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE9 VDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQKRYNPSKTSNGHQ :.:::.: : : : :: .:. . CCDS76 VEEILRESQHLTP-----------------------------GFTLQKWNDPTTRA---- 360 370 380 380 390 400 410 420 pF1KE9 SKSMLKDDLKLSSSED--------------SDGEQDCDKTMPRSTPGSNSEPSHHNSEGA : .::.:::::::.:: .. : .:. ::..: : . . : CCDS76 STKMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNP-VNPPLATPQPPPA 390 400 410 420 430 440 430 440 450 460 470 480 pF1KE9 DNSRDDSSSHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLNKV .. :.: : ::::: :::..:::..:::.:: . :.:::::: :::::::.::::: CCDS76 VQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNKV 450 460 470 480 490 500 490 500 510 520 530 pF1KE9 NPHKVS--------PASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPKETSSATPGRDS . .. : : ... : : .. . . . :. . ::: . :.. CCDS76 TSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVKT--NASQVPAEPKERPLLSLIREK 510 520 530 540 550 560 540 550 560 570 580 pF1KE9 ---KTIQKGSESGRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEEPRGGLK--IESET . :: :. ..: . :....:: :.:::::::.:: .. . : : : : CCDS76 ARPRPTQKIPETKALKHKLSTTSETVSQR-TIGKKQPKKVEKNTSTDEFTWPKPNITSST 570 580 590 600 610 590 600 610 620 630 640 pF1KE9 PVDLAS----SMPSSRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKSREII : . : . : .:.::. ..:: .:: . . . :::::.. .: ::::.: CCDS76 PKEKESVELHDPPRGRNKAT---AHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKSREFI 620 630 640 650 660 670 650 660 670 680 pF1KE9 ETDTSSSDS--DESESL-----PP----SSQTPKYPE------SNRTPVKPSSVEEEDSF :::.:.::: :. :.: :: ...: : : . : .. :. ... :. CCDS76 ETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNNNLSI 680 690 700 710 720 730 690 700 710 720 730 740 pF1KE9 FRQR-MFSPME--EKELLSPLSEPDDRYPLIVKIDLNLLTRIPGKPYKETEPPKGEKKNV .. :::. . :.:::: . .. : :::::.::.:.::. .. : : ..:.. CCDS76 SNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPDHKET 740 750 760 770 780 790 750 760 770 780 790 pF1KE9 PEKHTREAQKQASEKVSNKGKRKHKNEDDNRASESKKPKTEDKNSA-----------GHK : :.. : :: . ::::::: . . :: . :. .. :: CCDS76 ATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPAPPHK 800 810 820 830 840 850 800 810 820 830 840 pF1KE9 PSSNRESSKQSAA---KEKDLLPSPAGPVPSKDPKTEHGS-------RKRTISQSSSLKS : ..::.... : ::. :.: : .:.: :. .. : . ..:...... : CCDS76 PPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTGQITS 860 870 880 890 900 910 850 860 870 880 pF1KE9 SSNSNKETS------GSSKNSSSTSKQKKTEGKTSSSSK--------------EVKEKAP .. . : . : : : ..: :. .. : ... : : CCDS76 TKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNTAIATATVTATAIVTTTVTATAT 920 930 940 950 960 970 890 900 910 pF1KE9 SSSSNCPPSA---------------------------PTLDSSKP--RRTKLVFDDRNYS ..... .. : :.::. :: ::.::: .. CCDS76 ATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHN 980 990 1000 1010 1020 1030 920 930 940 950 960 970 pF1KE9 ADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECGNALEKNAQESKSPFPMYSETV ::.:.::::::::.:::: ..: ::: : ::..:: :::::.:.. :.:::. :::::: CCDS76 ADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETV 1040 1050 1060 1070 1080 1090 980 990 1000 1010 1020 1030 pF1KE9 DLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRLFKLKKENALKYSKTLTEHLK- .:..:.:.:::. .: :. .::.:.::: :: ::::::.:::::..:.:::..: :..: CCDS76 ELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQ 1100 1110 1120 1130 1140 1150 1040 1050 1060 1070 1080 1090 pF1KE9 NSYNNSQAPSPGLGSKAVGMPSPVS-PKLSPGNS-GNYSSGASSASASGSSVTIPQKIHQ :. . .: ::: . :.. . ::::: ..:: :. :: ..: :::::.::. CCDS76 NASKVAQIPSPWV-SNGKNTPSPVSLNNVSPINAMGNCNNGP---------VTIPQRIHH 1160 1170 1180 1190 1200 1100 1110 1120 1130 1140 1150 pF1KE9 MAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKVMGPLIFNASIMTDLVRYTRQG ::::.:..::: : . : ::.:..:..:.::::..:: .:::: ..: ::.::::.::: CCDS76 MAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSS-MTNLVRYVRQG 1210 1220 1230 1240 1250 1260 1160 pF1KE9 LHWLRQDAKLIS : ::: ::.:. CCDS76 LCWLRIDAHLL 1270 >>CCDS14684.1 AFF2 gene_id:2334|Hs108|chrX (1311 aa) initn: 1727 init1: 586 opt: 999 Z-score: 519.3 bits: 108.2 E(32554): 1.3e-22 Smith-Waterman score: 1951; 36.5% identity (61.2% similar) in 1213 aa overlap (103-1162:126-1311) 80 90 100 110 120 130 pF1KE9 KLVAIPKPTVPPSADEKSNPNFFEQRHGGSHQSSKWTPVGPAPSTSQSQKRSSGLQSGHS ::.. : .: : : :. ..:... CCDS14 GIPKNSVPQNPNNKNEPSFFPEQKNRIIPPHQDNT-HPSAPMPPPSVVILNSTLIHSNRK 100 110 120 130 140 150 140 150 160 170 180 pF1KE9 SQ----RTSAGSSS--GTNSSGQRHDRESYNNSGSSSRKKG--QHGSEHSKSRSSSPGKP :. : : . :. ....::: . .. ... :... . . .:. . ..: CCDS14 SKPEWSRDSHNPSTVLASQASGQPNKMQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNP 160 170 180 190 200 210 190 200 210 220 230 pF1KE9 QAVSSLNSSHSRSHGNDHHSKEHQRSKSPRDPDANWDSP-------SRVPFSSGQHSTQS :. ..:. : :.: :: .:.::.. . ..: : . ::: :.:. CCDS14 ---SAKEDSNPNSSGEDAF-KEIFQSNSPEESEFAVQAPGSPLVASSLLAPSSGL-SVQN 220 230 240 250 260 240 250 260 270 280 290 pF1KE9 FPPSLMSKSNSMLQKPTAYVRPMDGQES---MEPKLSSEHYSSQSHGN----SMTELKPS :::.:. :.. :::::::::::::.. . : :. .: :: .. . ::: CCDS14 FPPGLYCKTSMGQQKPTAYVRPMDGQDQAPDISPTLKPSIEFENSFGNLSFGTLLDGKPS 270 280 290 300 310 320 300 310 320 330 340 pF1KE9 ---SKAHLTKLKIPSQPLDASASGDVSCVDEILKEMTHSWPPPLTAIHTPCKTEPSKFPF ::..: :. : : ..: .: :::.:::.::::::: :::..:: ..: : : . CCDS14 AASSKTKLPKFTI-LQTSEVSLPSDPSCVEEILREMTHSWPTPLTSMHTAGHSEQSTFSI 330 340 350 360 370 380 350 360 370 380 390 pF1KE9 PTKESQQSNFGTGEQKRYNPS-KTSNGHQS-KSMLKDDLKLSSSED-------------- : .:::. . : :: .:. ..:. : ::::.:::::::.:: CCDS14 PGQESQHLTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTA 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE9 SDGEQDCDKTMPRSTPGSNSEPSHHNSEGADNSRDDSSSHSGSESSSGSDSESESSSSDS .. : .:. ::..: : . . : .. :.: : ::::: :::..:::..:: CCDS14 TELYQAVEKAKPRNNP-VNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDS 450 460 470 480 490 500 460 470 480 490 500 pF1KE9 EANEPSQSASPEPEPPPTNKWQLDNWLNKVNPHKVS--------PASSVDSNIPSSQGYK :.:: . :.:::::: :::::::.:::::. .. : : ... : : .. CCDS14 ESNEAPRVATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPME 510 520 530 540 550 560 510 520 530 540 550 560 pF1KE9 KEGREQGTGNSYTDTSGPKETSSATPGRDS---KTIQKGSESGRGRQKSPAQSDSTTQRR . . . :. . ::: . :.. . :: :. ..: . :....:: CCDS14 VQMKVK--TNASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQR- 570 580 590 600 610 620 570 580 590 600 610 pF1KE9 TVGKKQPKKAEKAAAEE----PRGGLKIESETPVDLAS----SMPSSRHKAATKGSRKPN :.:::::::.:: .. . :. . : : :: . : . : .:.::. ..:: CCDS14 TIGKKQPKKVEKNTSTDEFTWPKPN--ITSSTPKEKESVELHDPPRGRNKAT---AHKPA 630 640 650 660 670 620 630 640 650 660 pF1KE9 IKKESKSSPRPTAEKKKYKSTSKSSQKSREIIETDTSSSDS--DESESL-----PP---- .:: . . . :::::.. .: ::::.::::.:.::: :. :.: :: CCDS14 PRKEPRPNIPLAPEKKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIIS 680 690 700 710 720 730 670 680 690 700 710 pF1KE9 SSQTPKYPE------SNRTPVKPSSVEEEDSFFRQR-MFSPME--EKELLSPLSEPDDRY ...: : : . : .. :. ... :. .. :::. . :.:::: . .. CCDS14 GGNTAKSKEICGASLTLSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLK 740 750 760 770 780 790 720 730 740 750 760 770 pF1KE9 PLIVKIDLNLLTRIPGKPYKETEPPKGEKKNVPEKHTREAQKQASEKVSNKGKRKHKNED : :::::.::.:.::. .. : : ..:.. : :.. : :: . ::::::: . CCDS14 NLWVKIDLDLLSRVPGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIE 800 810 820 830 840 850 780 790 800 810 pF1KE9 DNRASESKKPKTEDKNSA-----------GHKPSSNRESSKQSAA---KEKDLLPSPAGP . :: . :. .. ::: ..::.... : ::. :.: : .: CCDS14 VAEKIPEKKQRLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSP 860 870 880 890 900 910 820 830 840 850 860 pF1KE9 VPSKDPKTEHGS-------RKRTISQSSSLKSSSNSNKETS------GSSKNSSSTSKQK .: :. .. : . ..:...... :.. . : . : : : ..: :. CCDS14 LPEDPPRRRNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKA 920 930 940 950 960 970 870 880 890 900 pF1KE9 K------------------TEGKTSSSSKEVKEKAPSSSSNCPPSAPT-------LDSSK . : :.. . . : ..... :. : .:::. CCDS14 SSATITVTNTAIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSH 980 990 1000 1010 1020 1030 910 920 930 940 pF1KE9 ---------P---------RRTKLVFDDRNYSADHYLQEAKKLKHNADALSDRFEKAVYY : :: ::.::: ..::.:.::::::::.:::: ..: ::: : CCDS14 LEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNY 1040 1050 1060 1070 1080 1090 950 960 970 980 990 1000 pF1KE9 LDAVVSFIECGNALEKNAQESKSPFPMYSETVDLIKYTMKLKNYLAPDATAADKRLTVLC ::..:: :::::.:.. :.:::. ::::::.:..:.:.:::. .: :. .::.:.::: CCDS14 ADAALSFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLC 1100 1110 1120 1130 1140 1150 1010 1020 1030 1040 1050 1060 pF1KE9 LRCESLLYLRLFKLKKENALKYSKTLTEHLK-NSYNNSQAPSPGLGSKAVGMPSPVS-PK :: ::::::.:::::..:.:::..: :..: :. . .: ::: . :.. . ::::: . CCDS14 YRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWV-SNGKNTPSPVSLNN 1160 1170 1180 1190 1200 1210 1070 1080 1090 1100 1110 pF1KE9 LSPGNS-GNYSSGASSASASGSSVTIPQKIHQMAASYVQVTSNFLYATEIWDQAEQLSKE .:: :. :: ..: :::::.::.::::.:..::: : . : ::.:..:..: CCDS14 VSPINAMGNCNNGP---------VTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRE 1220 1230 1240 1250 1260 1120 1130 1140 1150 1160 pF1KE9 QKEFFAELDKVMGPLIFNASIMTDLVRYTRQGLHWLRQDAKLIS .::::..:: .:::: ..: ::.::::.:::: ::: ::.:. CCDS14 NKEFFGDLDTLMGPLTQHSS-MTNLVRYVRQGLCWLRIDAHLL 1270 1280 1290 1300 1310 1163 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 03:25:39 2016 done: Mon Nov 7 03:25:40 2016 Total Scan time: 6.370 Total Display time: 0.620 Function used was FASTA [36.3.4 Apr, 2011]