FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1150, 593 aa
1>>>pF1KA1150 593 - 593 aa - 593 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.7261+/-0.000862; mu= 4.6039+/- 0.052
mean_var=175.6745+/-36.008, 0's: 0 Z-trim(113.6): 14 B-trim: 387 in 1/52
Lambda= 0.096765
statistics sampled from 14197 (14205) to 14197 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.758), E-opt: 0.2 (0.436), width: 16
Scan time: 3.880
The best scores are: opt bits E(32554)
CCDS1054.1 GATAD2B gene_id:57459|Hs108|chr1 ( 593) 3881 553.8 2.2e-157
CCDS12402.2 GATAD2A gene_id:54815|Hs108|chr19 ( 633) 826 127.4 5.6e-29
CCDS77270.1 GATAD2A gene_id:54815|Hs108|chr19 ( 634) 810 125.1 2.6e-28
>>CCDS1054.1 GATAD2B gene_id:57459|Hs108|chr1 (593 aa)
initn: 3881 init1: 3881 opt: 3881 Z-score: 2939.1 bits: 553.8 E(32554): 2.2e-157
Smith-Waterman score: 3881; 100.0% identity (100.0% similar) in 593 aa overlap (1-593:1-593)
10 20 30 40 50 60
pF1KA1 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 PSPDIIVLSDNEASSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEARL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PSPDIIVLSDNEASSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEARL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 VLLKKLRQSQLQKENVVQKTPVVQNAASIVQPSPAHVGQQGLSKLPSRPGAQGVEPQNLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VLLKKLRQSQLQKENVVQKTPVVQNAASIVQPSPAHVGQQGLSKLPSRPGAQGVEPQNLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 TLQGHSVIRSATNTTLPHMLMSQRVIAPNPAQLQGQRGPPKPGLVRTTTPNMNPAINYQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TLQGHSVIRSATNTTLPHMLMSQRVIAPNPAQLQGQRGPPKPGLVRTTTPNMNPAINYQP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 QSSSSVPCQRTTSSAIYMNLASHIQPGTVNRVSSPLPSPSAMTDAANSQAAAKLALRKQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QSSSSVPCQRTTSSAIYMNLASHIQPGTVNRVSSPLPSPSAMTDAANSQAAAKLALRKQL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 EKTLLEIPPPKPPAPLLHFLPSAANSEFIYMVGLEEVVQSVIDSQGKSCASLLRVEPFVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EKTLLEIPPPKPPAPLLHFLPSAANSEFIYMVGLEEVVQSVIDSQGKSCASLLRVEPFVC
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 AQCRTDFTPHWKQEKNGKILCEQCMTSNQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AQCRTDFTPHWKQEKNGKILCEQCMTSNQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 QQAALSPTTAPAVSSVSKQETIMRHHTLRQAPQPQSSLQRGIPTSARSMLSNFAQAPQLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QQAALSPTTAPAVSSVSKQETIMRHHTLRQAPQPQSSLQRGIPTSARSMLSNFAQAPQLS
490 500 510 520 530 540
550 560 570 580 590
pF1KA1 VPGGLLGMPGVNIAYLNTGIGGHKGPSLADRQREYLLDMIPPRSISQSISGQK
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VPGGLLGMPGVNIAYLNTGIGGHKGPSLADRQREYLLDMIPPRSISQSISGQK
550 560 570 580 590
>>CCDS12402.2 GATAD2A gene_id:54815|Hs108|chr19 (633 aa)
initn: 834 init1: 393 opt: 826 Z-score: 633.7 bits: 127.4 E(32554): 5.6e-29
Smith-Waterman score: 1237; 41.1% identity (61.8% similar) in 655 aa overlap (4-581:1-622)
10 20 30 40 50 60
pF1KA1 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP
:::.: : ::.:. .::: .:..::: .:: .:: : .
CCDS12 MTEEACRTRSQKRALERDPTEDDVESKKIKMERG-------LLA----SDL-NTDGD
10 20 30 40
70 80 90 100 110 120
pF1KA1 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT
.. : . :.: .: :: . : :. ..: :::: . .:. . :
CCDS12 MRV-TPEPGAG------PTQGLLRATEATAMAMGRGEGLVGDGPVDMRTSHSDMKSERRP
50 60 70 80 90
130 140 150 160 170
pF1KA1 PSPDIIVLSDNEA-SSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEAR
::::.::::::: :::: .. :: .. : . .. :::...::::..:::::::.
CCDS12 PSPDVIVLSDNEQPSSPRVNGLTTVALKETSTEALMKSSPEERERMIKQLKEELRLEEAK
100 110 120 130 140 150
180 190 200
pF1KA1 LVLLKKLRQSQLQKENVVQKT------------PVV---QNA---------------ASI
:::::::::::.::: ..:: :.: :: .:.
CCDS12 LVLLKKLRQSQIQKEATAQKPTGSVGSTVTTPPPLVRGTQNIPAGKPSLQTSSARMPGSV
160 170 180 190 200 210
210 220 230 240 250 260
pF1KA1 VQPSPAHVGQQGLSKLPSRPGAQGVEPQNLRTLQGHSVIRSATNTTLPHMLMSQRVIAPN
. : .. :::. ::: . ..: : : .: : ::. ..: : .:.. :. .:.
CCDS12 IPPPLVRGGQQASSKLGPQASSQVVMPPLVRGAQQIHSIRQHSSTGPPPLLLAPRASVPS
220 230 240 250 260 270
270 280 290 300 310 320
pF1KA1 PAQLQGQRGPPKPGLVRTTT-PNMNPAINYQPQSSSSVPCQRTTSSAIYMNLASHIQPGT
.:.:::: . ::.:... :: . .: :: . . :..:: .. : .
CCDS12 -VQIQGQR-IIQQGLIRVANVPNTSLLVNI-PQPTPASLKGTTATSA-----QANSTPTS
280 290 300 310 320 330
330 340 350 360 370 380
pF1KA1 VNRVSSPLPSPSAMTDAANSQAAAKLALRKQLEKTLLEIPPPKPPAPLLHFLPSAANSEF
: : . :: :. ::::::::::::::::::::::::::: ..:::::::.::
CCDS12 VASVVTSAESP------ASRQAAAKLALRKQLEKTLLEIPPPKPPAPEMNFLPSAANNEF
340 350 360 370 380
390 400 410 420 430 440
pF1KA1 IYMVGLEEVVQSVIDSQGK-SCASLLRVEPFVCAQCRTDFTPHWKQEKNGKILCEQCMTS
::.::::::::.....::. : :..: ::..::::.:::: .:..::.: :.::.:::.
CCDS12 IYLVGLEEVVQNLLETQGRMSAATVLSREPYMCAQCKTDFTCRWREEKSGAIMCENCMTT
390 400 410 420 430 440
450 460 470 480 490
pF1KA1 NQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQQQ------AALSPTTAP--AVSSVSK-
:::::::.:::.::: :::::::::::::::: :: : ::.:: ....: :
CCDS12 NQKKALKVEHTSRLKAAFVKALQQEQEIEQRLLQQGTAPAQAKAEPTAAPHPVLKQVIKP
450 460 470 480 490 500
500 510 520 530 540
pF1KA1 -QETIMRHHTLRQAP-----QPQSSLQRGIPTSARSMLSNFAQAPQLSVPGGLLGM----
.. .: :. : .:.:.:: :. :..: .:. .:.:. .. ..
CCDS12 RRKLAFRSGEARDWSNGAVLQASSQLSRGSATTPRGVLHTFSPSPKLQNSASATALVSRT
510 520 530 540 550 560
550 560 570 580
pF1KA1 ----------------------P---GVNIAYLNTGIGGHKGPSLADRQREYLLDMIPPR
: : ..:... ... ::. : .::::::::::::
CCDS12 GRHSERTVSAGKGSATSNWKKTPLSTGGTLAFVSPSLAVHKSSSAVDRQREYLLDMIPPR
570 580 590 600 610 620
590
pF1KA1 SISQSISGQK
CCDS12 SIPQSATWK
630
>>CCDS77270.1 GATAD2A gene_id:54815|Hs108|chr19 (634 aa)
initn: 1129 init1: 381 opt: 810 Z-score: 621.6 bits: 125.1 E(32554): 2.6e-28
Smith-Waterman score: 1225; 41.0% identity (61.7% similar) in 656 aa overlap (4-581:1-623)
10 20 30 40 50 60
pF1KA1 MDRMTEDALRLNLLKRSLDPADERDDVLAKRLKMEGHEAMERLKMLALLKRKDLANLEVP
:::.: : ::.:. .::: .:..::: .:: .:: : .
CCDS77 MTEEACRTRSQKRALERDPTEDDVESKKIKMERG-------LLA----SDL-NTDGD
10 20 30 40
70 80 90 100 110 120
pF1KA1 HELPTKQDGSGVKGYEEKLNGNLRPHGDNRTAGRPGKENINDEPVDMSARRSEPERGRLT
.. : . :.: .: :: . : :. ..: :::: . .:. . :
CCDS77 MRV-TPEPGAG------PTQGLLRATEATAMAMGRGEGLVGDGPVDMRTSHSDMKSERRP
50 60 70 80 90
130 140 150 160 170
pF1KA1 PSPDIIVLSDNEA-SSPRSSSRMEERLKAANLEMFKGKGIEERQQLIKQLRDELRLEEAR
::::.::::::: :::: .. :: .. : . .. :::...::::..:::::::.
CCDS77 PSPDVIVLSDNEQPSSPRVNGLTTVALKETSTEALMKSSPEERERMIKQLKEELRLEEAK
100 110 120 130 140 150
180 190 200
pF1KA1 LVLLKKLRQSQLQKENVVQKT------------PVV---QNA---------------ASI
:::::::::::.::: ..:: :.: :: .:.
CCDS77 LVLLKKLRQSQIQKEATAQKPTGSVGSTVTTPPPLVRGTQNIPAGKPSLQTSSARMPGSV
160 170 180 190 200 210
210 220 230 240 250 260
pF1KA1 VQPSPAHVGQQGLSKLPSRPGAQGVEPQNLRTLQGHSVIRSATNTTLPHMLMSQRVIAPN
. : .. :::. ::: . ..: : : .: : ::. ..: : .:.. :. .:.
CCDS77 IPPPLVRGGQQASSKLGPQASSQVVMPPLVRGAQQIHSIRQHSSTGPPPLLLAPRASVPS
220 230 240 250 260 270
270 280 290 300 310 320
pF1KA1 PAQLQGQRGPPKPGLVRTTT-PNMNPAINYQPQSSSSVPCQRTTSSAIYMNLASHIQPGT
.:.:::: . ::.:... :: . .: :: . . :..:: .. : .
CCDS77 -VQIQGQR-IIQQGLIRVANVPNTSLLVNI-PQPTPASLKGTTATSA-----QANSTPTS
280 290 300 310 320 330
330 340 350 360 370 380
pF1KA1 VNRVSSPLPSPSAMTDAANSQAAAKLALRKQLEKTLLEIPPPKPPAPLLHFLPSAANSEF
: : . :: :. ::::::::::::::::::::::::::: ..:::::::.::
CCDS77 VASVVTSAESP------ASRQAAAKLALRKQLEKTLLEIPPPKPPAPEMNFLPSAANNEF
340 350 360 370 380
390 400 410 420 430 440
pF1KA1 IYMVGLEEVVQSVIDSQ-GK-SCASLLRVEPFVCAQCRTDFTPHWKQEKNGKILCEQCMT
::.::::::::.....: :. : :..: ::..::::.:::: .:..::.: :.::.:::
CCDS77 IYLVGLEEVVQNLLETQAGRMSAATVLSREPYMCAQCKTDFTCRWREEKSGAIMCENCMT
390 400 410 420 430 440
450 460 470 480 490
pF1KA1 SNQKKALKAEHTNRLKNAFVKALQQEQEIEQRLQQQ------AALSPTTAP--AVSSVSK
.:::::::.:::.::: :::::::::::::::: :: : ::.:: ....: :
CCDS77 TNQKKALKVEHTSRLKAAFVKALQQEQEIEQRLLQQGTAPAQAKAEPTAAPHPVLKQVIK
450 460 470 480 490 500
500 510 520 530 540
pF1KA1 --QETIMRHHTLRQAP-----QPQSSLQRGIPTSARSMLSNFAQAPQLSVPGGLLGM---
.. .: :. : .:.:.:: :. :..: .:. .:.:. .. ..
CCDS77 PRRKLAFRSGEARDWSNGAVLQASSQLSRGSATTPRGVLHTFSPSPKLQNSASATALVSR
510 520 530 540 550 560
550 560 570 580
pF1KA1 -----------------------P---GVNIAYLNTGIGGHKGPSLADRQREYLLDMIPP
: : ..:... ... ::. : .::::::::::::
CCDS77 TGRHSERTVSAGKGSATSNWKKTPLSTGGTLAFVSPSLAVHKSSSAVDRQREYLLDMIPP
570 580 590 600 610 620
590
pF1KA1 RSISQSISGQK
CCDS77 RSIPQSATWK
630
593 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 02:07:06 2016 done: Sat Nov 5 02:07:07 2016
Total Scan time: 3.880 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]