FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1685, 1435 aa
1>>>pF1KA1685 1435 - 1435 aa - 1435 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.8325+/-0.00115; mu= -10.1586+/- 0.069
mean_var=410.9125+/-83.912, 0's: 0 Z-trim(114.2): 15 B-trim: 0 in 0/52
Lambda= 0.063270
statistics sampled from 14755 (14767) to 14755 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.454), width: 16
Scan time: 6.840
The best scores are: opt bits E(32554)
CCDS45847.1 ASXL3 gene_id:80816|Hs108|chr18 (2248) 767 85.5 1.9e-15
CCDS13201.1 ASXL1 gene_id:171023|Hs108|chr20 (1541) 693 78.6 1.5e-13
>>CCDS45847.1 ASXL3 gene_id:80816|Hs108|chr18 (2248 aa)
initn: 1759 init1: 685 opt: 767 Z-score: 390.7 bits: 85.5 E(32554): 1.9e-15
Smith-Waterman score: 1250; 28.4% identity (53.7% similar) in 1429 aa overlap (1-1392:1-1225)
10 20 30 40 50 60
pF1KA1 MREKGRRKKGRTWAEAAKTVLEKYPNTPMSHKEILQVIQREGLKEIRSGTSPLACLNAML
:..: :.:: :::::::. .:::.::.::. :.::.:::.::::: :::::::::::::
CCDS45 MKDK-RKKKDRTWAEAARLALEKHPNSPMTAKQILEVIQKEGLKET-SGTSPLACLNAML
10 20 30 40 50
70 80 90 100 110 120
pF1KA1 HTNSRGEEGIFYKVPGRMGVYTLKKDVPDGVKELSEGSEESSDGQSDSQSSENSSSSSDG
:::.: .: :.:.::. :.:.:::. : : .. . : .:. . .. . ...
CCDS45 HTNTRIGDGTFFKIPGKSGLYALKKE------ESSCPADGTLDLVCESELDGTDMAEANA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KA1 GSNKEGKKSRWKRKVSSSSPQSGCPSPTIPAGKVISPSQKHSKKALKQALKQQQQKKQQQ
....: :. .::. .:. . .. . :..: :.:.::::::::.:::..
CCDS45 HGEENGVCSKQVTDEASSTRDSSLTNTAVQS-KLVSSFQQHTKKALKQALRQQQKR----
120 130 140 150 160
190 200 210 220 230 240
pF1KA1 QCRPSISISSNQHLSLKTVKAASDSVPAKPATWEGKQSDGQTGSPQNSNSSFSSSVKVEN
: ..:. : ::: : : .:::. .:: .... . ::. ....
CCDS45 --RNGVSMMVN-----KTVP----RVVLTPLKVSDEQSDSPSGSESKNGEADSSDKEMKH
170 180 190 200 210
250 260 270 280 290
pF1KA1 TLLG-LGKKSFQRSERLHTR---QMKRTKCADIDVETPDSILVNTNLRALINKHTFSVLP
. ::.. :. .::. ..: :: :::.::: :::::::::::::::::. ::
CCDS45 GQKSPTGKQTSQHLKRLKKSGLGHLKWTKAEDIDIETPGSILVNTNLRALINKHTFASLP
220 230 240 250 260 270
300 310 320 330 340 350
pF1KA1 GDCQQRLLLLLPEVDRQVGPDGLMKLNGSALNNEFFTSAAQGWKERLSEGEFTPEMQVRI
:: :::::::::::.: ::...:. ::::::::. ::::::.::.:::::::::.::
CCDS45 QHFQQYLLLLLPEVDRQMGSDGILRLSTSALNNEFFAYAAQGWKQRLAEGEFTPEMQLRI
280 290 300 310 320 330
360 370 380 390 400 410
pF1KA1 RQEIEKEKKVEPWKEQFFESYYGQSSGLSLEDSKKLTASPSDPKVKKTPAEQPKSMPVSE
:::::::::.:::::.::: .::.. :.: :.: :::..:.. .... . ...:::
CCDS45 RQEIEKEKKTEPWKEKFFERFYGEKLGMSREESVKLTTGPNNAGAQSSSSCGTSGLPVSA
340 350 360 370 380 390
420 430 440 450 460 470
pF1KA1 ASLIRIVPVVSQSECKEEALQMSSPGRKEECESQGEVQPNFSTSSEPLL----SSALNTH
. . ... .:.::. : :.: .. :.. .. .
CCDS45 QTAL----------AEQQPKSMKSPASPE---------PGFCATLCPMVEIPPKDIMAEL
400 410 420 430
480 490 500 510 520 530
pF1KA1 ELSSIL-PIKCPKDEDLLEQKPVTSAEQESEKNHLTTASNYNKSESQESLVTSPSKPKSP
: .:: : . .:.. :. .. : ..: :: : .. :: :::..:
CCDS45 ESEDILIPEESVIQEEIAEEVETSICECQDE-NH-KTIPEF--SEEAESLTNSH------
440 450 460 470 480
540 550 560 570 580 590
pF1KA1 GVEKPIVKPTAGAGPQETNMKEPLATLVDQSPESLKRKSSLTQEEAPVSWEKRPRVTENR
:.: . : . . :.. : :: . ... :: ::: : ..
CCDS45 --EEPQIAPPEDNLESCVMMNDVLETL-PHIEVKIEGKSESPQEEMTVVIDQ--------
490 500 510 520 530
600 610 620 630 640 650
pF1KA1 QHQQPFQVSPQPFLNRGDRIQVRKVPPLKIPVSRISPMPFHPSQVSPRARFPVSITSPN-
:. : . .: . ....: . :... : ..:.
CCDS45 -------------LEVCDSL----IPSTS-SMTHVSDTEHKESETA------VETSTPKI
540 550 560 570
660 670 680 690 700 710
pF1KA1 RTGARTLADIKAKAQLVKAQRAAAAAAAAAAAAASVGGTIPGPGPGGGQGPGEGGEGQTA
.::. .: :: :.:: .
CCDS45 KTGSSSLE---------------------------------------GQFPNEGIAIDME
580 590
720 730 740 750 760 770
pF1KA1 RGGSPGSDRVSETGKGPTLELAGTGSRGGTRELLPCGPETQPQSETKTTPSQAQPHSVSG
..: ...::.. ... . .:. : : ::: :: . ::
CCDS45 LQSDP-EEQLSENACISETSFSSESPEGACTSLPSPGGETQSTSEESCTP----------
600 610 620 630 640
780 790 800 810 820 830
pF1KA1 AQLQQTPPVPPTPAVSGACTSVPSPAHIEKLDNEKLNPTRATATVASVSHPQGPSSCRQE
:.:. : :. : : . .: .... . :.. : :
CCDS45 ASLETT-----------FCSEVSSTENTDKYNQRNSTDENFHASLMS------------E
650 660 670
840 850 860 870 880 890
pF1KA1 KAPSPTGPALISGASPVHCAADGTVELKAGPSKNIPNPSASSKTDASVPVAVTPSPLTSL
.: :.: :: :: .. . .:.: .:.: : .: ...:.. : ..:.
CCDS45 ISPISTSPE-ISEAS---LMSNLPLTSEASPVSNLPLTSETSPM-SDLPLTSETSSVSSM
680 690 700 710 720 730
900 910 920 930 940
pF1KA1 LTTAT---LEKLPVPQVSATTAPAGSAPPSSTLPAASSLKTPGTSLNMNGPTLRPTSSIP
: :. . .::.: . :.: ... . . : .. :.:..: . .: . ::
CCDS45 LLTSETTFVSSLPLP---SETSPISNSSINERM-AHQQRKSPSVSEEPLSPQ-KDESSAT
740 750 760 770 780
950 960 970 980 990 1000
pF1KA1 ANNPLVTQLL-QGKDVPMEQILPKPLTKVEMKTVPLTAKEERGMGALIATNTTENSTREE
:. :: .: : :.. :.:. . .: . : : . .... . .
CCDS45 AK-PLGENLTSQQKNLSN---TPEPIIMSSSSIAPEAFPSED----LHNKTLSQQTCKSH
790 800 810 820 830 840
1010 1020 1030 1040 1050 1060
pF1KA1 VNERQSHPATQQQLGKT--LQSKQLPQVPRPLQLFSAKELRDSSIDTHQYHEGLSKATQD
:. .. .::. .:..: .. :. . : . :.. : .. . :: :..
CCDS45 VDTEKPYPASIPELASTEMIKVKNHSVLQR-----TEKKVLPSPLELSVFSEG----TDN
850 860 870 880 890
1070 1080 1090 1100 1110 1120
pF1KA1 QILQTLIQRVRRQNLLSVVPPSQFNFAHSGFQLEDISTSQRFMLGFAGRRTSKPAMAGHY
. . ... .. .: : . :. . . .. ::..:. . ... .:.:. .
CCDS45 KGNELPSAKLQDKQYISSVDKAPFSEGSRNKTHKQGSTQSRLETSHTSK-SSEPSKSPDG
900 910 920 930 940 950
1130 1140 1150 1160 1170 1180
pF1KA1 LLNISTYGRGSESFRRTHSVNPEDRFCLSSPTEALKMGYTDCKNATGESSSSKEDDTDEE
. : : : :: .: .. . : . . .: . .: .. : ::. ::
CCDS45 IRNES---RDSEISKR--KTAEQHSFGICKEKRARIEDDQSTRNISSSSPPEKEQPPREE
960 970 980 990 1000
1190 1200 1210 1220 1230
pF1KA1 STGDE---QES-----VTVKEEPQVSQSAGKGDTS---SGPHSRETLSTSDCLA-SKNVK
: : .: .: ::. ....:: :: .. . . .: : .....
CCDS45 PRVPPLKIQLSKIGPPFIIKSQP-VSKPESRASTSTSVSGGRNTGARTLADIKARAQQAR
1010 1020 1030 1040 1050 1060
1240 1250 1260 1270 1280
pF1KA1 AEIPLNEQTTLSKENYLFTR-----GQTFDEKTLARDLIQAAQKQMA-HAVRGKAIRSSP
:. .... . . :. .:::. :. : .: : .:.. ...:
CCDS45 AQREAAAAAAVAAAASIVSGAMGSPGEGGKTRTLAHIKEQTKAKLFAKHQARAHLFQTSK
1070 1080 1090 1100 1110 1120
1290 1300 1310 1320 1330 1340
pF1KA1 ELFSSTVLPLPADSPTHQP-LLLPPLQTPKLYGSPTQI--GPSYRGMINVSTSSDMDHNS
: : :: : .: : : . :. :: : .:. :. : :. . ...
CCDS45 E----TRLPPPLSSKEGPPNLEVSSTPETKMEGSTGVIIVNPNCRSPSN--KSAHLRETT
1130 1140 1150 1160 1170
1350 1360 1370 1380 1390 1400
pF1KA1 AVPGSQVSSNVGDVMSFSVTVTTIPASQAMNPSSHGQTIPVQAFSEENSIEGTPSKCYCR
.: : : : . . ..: .. .:. : :: . :.. : :::
CCDS45 TV--LQQSLNPSK-LPETATDLSVHSSDENIPVSHLSEKIVSSTSSENSSVPMLFNKNSV
1180 1190 1200 1210 1220 1230
1410 1420 1430
pF1KA1 LKAMIMCKGCGAFCHDDCIGPSKLCVSCLVVR
CCDS45 PVSVCSTAISGAIKEHPFVSSVDKSSVLMSVDSANTTISACNISMLKTIQGTDTPCIAII
1240 1250 1260 1270 1280 1290
>>CCDS13201.1 ASXL1 gene_id:171023|Hs108|chr20 (1541 aa)
initn: 1581 init1: 629 opt: 693 Z-score: 356.6 bits: 78.6 E(32554): 1.5e-13
Smith-Waterman score: 1358; 33.1% identity (59.2% similar) in 1030 aa overlap (1-976:1-948)
10 20 30 40 50 60
pF1KA1 MREKGRRKKGRTWAEAAKTVLEKYPNTPMSHKEILQVIQREGLKEIRSGTSPLACLNAML
:..: ..:: :::::::. :::.: ..::. :.:::::. :::::.::::::::::::::
CCDS13 MKDKQKKKKERTWAEAARLVLENYSDAPMTPKQILQVIEAEGLKEMRSGTSPLACLNAML
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 HTNSRGEEGIFYKVPGRMGVYTLKKDVPDGVKELSEGSEESSDGQSDSQSSENSSSSSDG
:.:::: ::.:::.:::....:::::. . .. . : . .: .: .. .:. .
CCDS13 HSNSRGGEGLFYKLPGRISLFTLKKDALQWSRHPATVEGEEPEDTADVESCGSNEASTVS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 GSNKEGKKSRWKRKVSSSSPQSGCPSPTIPAGKVISPSQKHSKKALKQALKQQQQKKQQQ
: : . .. .: ...: . . .. .: . . : .: .:: : :::.
CCDS13 GENDVS--------LDETSSNASCSTES--QSRPLS-NPRDSYRASSQANK---QKKKTG
130 140 150 160
190 200 210 220 230
pF1KA1 QCRPSISISSNQHLSLKTVKAASDSVPAKPATWEGKQSDGQTGSPQNSNSSF----SSSV
: . .. ::. : .:. . . : ..::..:::..:.:. :...
CCDS13 VMLPRVVLTP-----LKVNGAHVESASG----FSGCHADGESGSPSSSSSGSLALGSAAI
170 180 190 200 210
240 250 260 270 280 290
pF1KA1 KVENTLLGLGKKSFQRSERLHTRQMKRTKCADIDVETPDSILVNTNLRALINKHTFSVLP
. . . .. .. : ::::.. .:: ::: :::::::::::::..:: .::
CCDS13 RGQAEVTQDPAPLLRGFRKPATGQMKRNRGEEIDFETPGSILVNTNLRALINSRTFHALP
220 230 240 250 260 270
300 310 320 330 340 350
pF1KA1 GDCQQRLLLLLPEVDRQVGPDGLMKLNGSALNNEFFTSAAQGWKERLSEGEFTPEMQVRI
. ::.::.:::::::::: :::..:..::::::::: :::.:.:::..:::: ::::::
CCDS13 SHFQQQLLFLLPEVDRQVGTDGLLRLSSSALNNEFFTHAAQSWRERLADGEFTHEMQVRI
280 290 300 310 320 330
360 370 380 390 400 410
pF1KA1 RQEIEKEKKVEPWKEQFFESYYGQSSGLSLEDSKKLTASPSDPKVKK---TPAEQPKSMP
:::.::::::: :::.:::.::::. ::. :.: . ... . ..:. .:.:. . .
CCDS13 RQEMEKEKKVEQWKEKFFEDYYGQKLGLTKEESLQQNVGQEEAEIKSGLCVPGESVR-IQ
340 350 360 370 380 390
420 430 440 450 460 470
pF1KA1 VSEASLIRIVPVVSQSECKEEALQMSSPGRKEECESQGEVQPNFSTSSE-PLLSSALNTH
. :. : ..:. .. . .:.: :. : .. :..:. :: ...
CCDS13 RGPATRQRDGHFKKRSRPDLRTRARRNLYKKQESEQAGVAKDAKSVASDVPLYKDGEAKT
400 410 420 430 440 450
480 490 500 510 520 530
pF1KA1 ELSSILPIKCPKDEDLLEQKPVTSAEQESEKNHLTTASNYNKSESQ-ESLVTSPSKP-KS
. ... . : ..:: . : .. . : .. ... ..:. . ..: .
CCDS13 DPAGLSSPHLPG---------TSSAAPDLEGPEFPVESVASRIQAEPDNLARASASPDRI
460 470 480 490 500
540 550 560 570 580
pF1KA1 PGVEKPIVKPTAGAGPQETNMKEPLATLVDQSPESLKRKSSLTQEEAPVSW-EKRPRVTE
:.. :::: ::: :.. :::: .. : .:. ::.::. :
CCDS13 PSL------------PQET---------VDQEPKDQKRKS--FEQAASASFPEKKPRL-E
510 520 530 540
590 600 610 620 630
pF1KA1 NRQH-----QQPFQVSPQPFLNRGDRIQVRKVPPLKIPVSRISPMPF----HPS-QVSPR
.:: .. .::: .. ::::..: .:::.: :. .:. :. ::
CCDS13 DRQSFRNTIESVHTEKPQPTKEEP------KVPPIRIQLSRIKP-PWVVKGQPTYQICPR
550 560 570 580 590
640 650 660 670 680 690
pF1KA1 ARFPVSITS-PNRTGARTLADIKAKAQLVKAQRAAAAAAAAAAAAASVGGTIPGPGPGGG
.:.. .: . :::::::::::.: :.. :. ::..: . :: ::: :::
CCDS13 I-IPTTESSCRGWTGARTLADIKARALQVRGARGHHCHREAATTAIGGGG---GPGGGGG
600 610 620 630 640 650
700 710 720 730 740 750
pF1KA1 QGPGEGG-EGQTARGGSPGSDRVSETGKGPTLELAGTGSRGGTRELLPCGPETQPQSETK
. ::: .:... :. . . : ::. :.. : .::: : . ....
CCDS13 GATDEGGGRGSSSGDGGEACGHPEPRG-GPSTPGKCTSDLQRT-QLLPPYPLNGEHTQAG
660 670 680 690 700 710
760 770 780 790 800 810
pF1KA1 TTPSQAQPHSVSGAQ-----LQQTPPVPPTPAVSGACTSVP-SPAHIEKLDNEKLNPTRA
:. :.:. ... . . : : : : .. : ...: .:. . . : ...
CCDS13 TAMSRARREDLPSLRKEESCLLQRATVGLTDGL-GDASQLPVAPTGDQPCQALPLLSSQT
720 730 740 750 760
820 830 840 850 860
pF1KA1 TATVASVSHPQGPSSCRQEKAPSPT---------GPALISGASPVHC-AADGTVELKAGP
... : .:: . : : . : ::.. . .:. ..: :.: .:
CCDS13 SVAERLVEQPQLHPDVRTECESGTTSWESDDEEQGPTVPADNGPIPSLVGDDTLEKGTGQ
770 780 790 800 810 820
870 880 890 900 910
pF1KA1 SKNIPNPSASSKTDASVPVAVTPSPLTSLLTTATLEKLPVPQVSATTAPAGSAPP-----
. . .:. .. :: :::: : .. . : . . .:: ::
CCDS13 ALD-SHPTMKD------PVNVTPS---STPESSPTDCLQNRAFDDELGLGGSCPPMRESD
830 840 850 860 870
920 930 940 950 960
pF1KA1 -------SSTLPAASSLK---TPGTSLNMNGPTLRPTSSIPANNPLVTQLLQGKDVPMEQ
...: . :::. :... .. : . ::. .: : . . : .:
CCDS13 TRQENLKTKALVSNSSLHWIPIPSNDEVVKQPKPESREHIPSVEPQVGEEWE-KAAPTPP
880 890 900 910 920 930
970 980 990 1000 1010 1020
pF1KA1 ILPKPLTKVEMKTVPLTAKEERGMGALIATNTTENSTREEVNERQSHPATQQQLGKTLQS
:: :: :
CCDS13 ALPGDLTAEEGLDPLDSLTSLWTVPSRGGSDSNGSYCQQVDIEKLKINGDSEALSPHGES
940 950 960 970 980 990
1435 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 21:51:16 2016 done: Wed Nov 2 21:51:17 2016
Total Scan time: 6.840 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]