FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1402, 772 aa
1>>>pF1KA1402 772 - 772 aa - 772 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6156+/-0.000915; mu= 6.6252+/- 0.056
mean_var=183.3079+/-37.081, 0's: 0 Z-trim(112.8): 7 B-trim: 317 in 1/52
Lambda= 0.094729
statistics sampled from 13491 (13498) to 13491 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.729), E-opt: 0.2 (0.415), width: 16
Scan time: 4.350
The best scores are: opt bits E(32554)
CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 ( 772) 5229 727.2 2.4e-209
CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 ( 764) 5104 710.1 3.3e-204
CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 ( 775) 2331 331.1 4.1e-90
CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 ( 613) 2029 289.8 9e-78
CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 ( 802) 486 79.0 3.4e-14
CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 ( 882) 444 73.3 1.9e-12
>>CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 (772 aa)
initn: 5229 init1: 5229 opt: 5229 Z-score: 3871.8 bits: 727.2 E(32554): 2.4e-209
Smith-Waterman score: 5229; 100.0% identity (100.0% similar) in 772 aa overlap (1-772:1-772)
10 20 30 40 50 60
pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV
670 680 690 700 710 720
730 740 750 760 770
pF1KA1 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST
730 740 750 760 770
>>CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 (764 aa)
initn: 5080 init1: 5080 opt: 5104 Z-score: 3779.5 bits: 710.1 E(32554): 3.3e-204
Smith-Waterman score: 5104; 98.4% identity (98.8% similar) in 767 aa overlap (6-772:1-764)
10 20 30 40 50 60
pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR
.:.: :: :: .: ::::::::::::::::::::::::::::::::::::
CCDS64 MLSLARPPLP---PTGLRTSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR
10 20 30 40 50
70 80 90 100 110 120
pF1KA1 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KA1 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 NRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFI
120 130 140 150 160 170
190 200 210 220 230 240
pF1KA1 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 MQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLR
180 190 200 210 220 230
250 260 270 280 290 300
pF1KA1 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KA1 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 SAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGEAGLSWPVGL
300 310 320 330 340 350
370 380 390 400 410 420
pF1KA1 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETALEQLNRRYQP
360 370 380 390 400 410
430 440 450 460 470 480
pF1KA1 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 RLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRPLSRVEILPM
420 430 440 450 460 470
490 500 510 520 530 540
pF1KA1 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD
480 490 500 510 520 530
550 560 570 580 590 600
pF1KA1 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG
540 550 560 570 580 590
610 620 630 640 650 660
pF1KA1 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI
600 610 620 630 640 650
670 680 690 700 710 720
pF1KA1 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAV
660 670 680 690 700 710
730 740 750 760 770
pF1KA1 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS64 EPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST
720 730 740 750 760
>>CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 (775 aa)
initn: 2696 init1: 1004 opt: 2331 Z-score: 1731.3 bits: 331.1 E(32554): 4.1e-90
Smith-Waterman score: 2870; 56.9% identity (78.7% similar) in 795 aa overlap (1-772:1-775)
10 20 30 40 50
pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQ---GEGE----DPCVEAVGERGGPQ
:: : ::..:::: :. .:.::: .:::: :.:.. : : : . :. .. .
CCDS24 MRASLLLSVLRPAGPVAVGISLGFTLSLLSVTWVEEPCGPGPPQPGDSELPPRGNTNAAR
10 20 30 40 50 60
60 70 80 90 100
pF1KA1 NPDS------RARLDQSD---EDFKPRIVPYY-RDPNKPYKKVLRTRYIQTELGSRERLL
:.: : . .. :...::..::. .:.. ::..:::::.:::: :.:::
CCDS24 RPNSVQPGAEREKPGAGEGAGENWEPRVLPYHPAQPGQAAKKAVRTRYISTELGIRQRLL
70 80 90 100 110 120
110 120 130 140 150 160
pF1KA1 VAVLTSRATLSTLAVAVNRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSET
::::::..:: ::.::::::..:.. :....:: :: ::: :: ::. :.::: . .
CCDS24 VAVLTSQTTLPTLGVAVNRTLGHRLERVVFLTGARGRRAPPGMAVVTLGEERPIGHLHLA
130 140 150 160 170 180
170 180 190 200 210 220
pF1KA1 LRHLHTHFGADYDWFFIMQDDTYVQAPRLAALAGHLSINQ--DLYLGRAEEFIGAGEQA-
:::: . : :.::::.. : ::..: :: :.::::. . ::::: ..::: :: .
CCDS24 LRHLLEQHGDDFDWFFLVPDTTYTEAHGLARLTGHLSLASAAHLYLGRPQDFIG-GEPTP
190 200 210 220 230
230 240 250 260 270
pF1KA1 -RYCHGGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ
:::::::: :::: :: .:::::.:::.::.:::::::::::..:. ::::...:.: .
CCDS24 GRYCHGGFGVLLSRMLLQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHEGVH
240 250 260 270 280 290
280 290 300 310 320 330
pF1KA1 YRSFELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQ
: .::. . .: .::. : ::...::: . . ::.::: :. ::::.:.::..:: .
CCDS24 YSHLELSPG-EPVQEGDPHFRSALTAHPVRDPVHMYQLHKAFARAELERTYQEIQELQWE
300 310 320 330 340 350
340 350 360 370 380 390
pF1KA1 IRNLTVLTPEGEAGLSWPVGLPAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGAS
:.: . :. .:. . .::::.::: : :::::: ::::::::.::::::.:.:::.::.
CCDS24 IQNTSHLAVDGDQAAAWPVGIPAPSRPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGAD
360 370 380 390 400 410
400 410 420 430 440 450
pF1KA1 RADVGDALETALEQLNRRYQPRLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHR
::::.:.: ::::.:::::.: ::.:::.:.:::::::::::::::::: :: .: .: :
CCDS24 RADVADVLGTALEELNRRYHPALRLQKQQLVNGYRRFDPARGMEYTLDLQLEALTPQGGR
420 430 440 450 460 470
460 470 480 490 500 510
pF1KA1 RALARRVSLLRPLSRVEILPMPYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPRE
: :.:::.::::::::::::.::::::.:. ..::: .:: ::.::::::. .::: .
CCDS24 RPLTRRVQLLRPLSRVEILPVPYVTEASRLTVLLPLAAAERDLAPGFLEAFATAALEPGD
480 490 500 510 520 530
520 530 540 550 560 570
pF1KA1 HAL-LTLLLVYGPREGGRGA-PDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLM
: :::::.: ::.. : : : : ::: .::::::.::.:. ::.:.. ::: .:::
CCDS24 AAAALTLLLLYEPRQAQRVAHADVFAPVKAHVAELERRFPGARVPWLSVQTAAPSPLRLM
540 550 560 570 580 590
580 590 600 610 620 630
pF1KA1 DVVSKKHPVDTLFFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPP
:..:::::.::::.:. : :. ::::::.::::::::::.::: :.::..: ..:
CCDS24 DLLSKKHPLDTLFLLAGPDTVLTPDFLNRCRMHAISGWQAFFPMHFQAFHPAVAPPQGP-
600 610 620 630 640 650
640 650 660 670 680 690
pF1KA1 GPPGAGPDPPSPPGADPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEE
::: : : :::::::..:.::::.::.:::.:::. :...:::
CCDS24 GPPELGRDT---------------GRFDRQAASEACFYNSDYVAARGRLAA--ASEQEEE
660 670 680 690 700
700 710 720 730 740 750
pF1KA1 ALEGLEVMDVFLRFSGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRA
::.:.:...::.::.::..:::::.:.:.. . :: ::::.::::: : :::::.:.
CCDS24 LLESLDVYELFLHFSSLHVLRAVEPALLQRYRAQTCSARLSEDLYHRCLQSVLEGLGSRT
710 720 730 740 750 760
760 770
pF1KA1 QLAMALFEQEQANST
:::: ::::::.:::
CCDS24 QLAMLLFEQEQGNST
770
>>CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 (613 aa)
initn: 2303 init1: 1004 opt: 2029 Z-score: 1509.7 bits: 289.8 E(32554): 9e-78
Smith-Waterman score: 2463; 59.7% identity (80.6% similar) in 633 aa overlap (146-772:1-613)
120 130 140 150 160 170
pF1KA1 LAVAVNRTVAHHFPRLLYFTGQRGARAPAGMQVVSHGDERPAWLMSETLRHLHTHFGADY
: ::. :.::: . .:::: . : :.
CCDS56 MAVVTLGEERPIGHLHLALRHLLEQHGDDF
10 20 30
180 190 200 210 220 230
pF1KA1 DWFFIMQDDTYVQAPRLAALAGHLSINQ--DLYLGRAEEFIGAGEQA--RYCHGGFGYLL
::::.. : ::..: :: :.::::. . ::::: ..::: :: . :::::::: ::
CCDS56 DWFFLVPDTTYTEAHGLARLTGHLSLASAAHLYLGRPQDFIG-GEPTPGRYCHGGFGVLL
40 50 60 70 80
240 250 260 270 280 290
pF1KA1 SRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDP
:: :: .:::::.:::.::.:::::::::::..:. ::::...:.: .: .::. . .:
CCDS56 SRMLLQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHEGVHYSHLELSPG-EP
90 100 110 120 130 140
300 310 320 330 340 350
pF1KA1 EKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQIRNLTVLTPEGE
.::. : ::...::: . . ::.::: :. ::::.:.::..:: .:.: . :. .:.
CCDS56 VQEGDPHFRSALTAHPVRDPVHMYQLHKAFARAELERTYQEIQELQWEIQNTSHLAVDGD
150 160 170 180 190 200
360 370 380 390 400 410
pF1KA1 AGLSWPVGLPAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGASRADVGDALETAL
. .::::.::: : :::::: ::::::::.::::::.:.:::.::.::::.:.: :::
CCDS56 QAAAWPVGIPAPSRPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGADRADVADVLGTAL
210 220 230 240 250 260
420 430 440 450 460 470
pF1KA1 EQLNRRYQPRLRFQKQRLLNGYRRFDPARGMEYTLDLLLECVTQRGHRRALARRVSLLRP
:.:::::.: ::.:::.:.:::::::::::::::::: :: .: .: :: :.:::.::::
CCDS56 EELNRRYHPALRLQKQQLVNGYRRFDPARGMEYTLDLQLEALTPQGGRRPLTRRVQLLRP
270 280 290 300 310 320
480 490 500 510 520 530
pF1KA1 LSRVEILPMPYVTEATRVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHAL-LTLLLVYG
::::::::.::::::.:. ..::: .:: ::.::::::. .::: . : :::::.:
CCDS56 LSRVEILPVPYVTEASRLTVLLPLAAAERDLAPGFLEAFATAALEPGDAAAALTLLLLYE
330 340 350 360 370 380
540 550 560 570 580
pF1KA1 PREGGRGA-PDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTL
::.. : : : : ::: .::::::.::.:. ::.:.. ::: .::::..:::::.:::
CCDS56 PRQAQRVAHADVFAPVKAHVAELERRFPGARVPWLSVQTAAPSPLRLMDLLSKKHPLDTL
390 400 410 420 430 440
590 600 610 620 630 640
pF1KA1 FFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSP
:.:. : :. ::::::.::::::::::.::: :.::..: ..: ::: : :
CCDS56 FLLAGPDTVLTPDFLNRCRMHAISGWQAFFPMHFQAFHPAVAPPQGP-GPPELGRDT---
450 460 470 480 490 500
650 660 670 680 690 700
pF1KA1 PGADPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFL
:::::::..:.::::.::.:::.:::. :...::: ::.:.:...::
CCDS56 ------------GRFDRQAASEACFYNSDYVAARGRLAA--ASEQEEELLESLDVYELFL
510 520 530 540 550
710 720 730 740 750 760
pF1KA1 RFSGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQA
.::.::..:::::.:.:.. . :: ::::.::::: : :::::.:.:::: ::::::.
CCDS56 HFSSLHVLRAVEPALLQRYRAQTCSARLSEDLYHRCLQSVLEGLGSRTQLAMLLFEQEQG
560 570 580 590 600 610
770
pF1KA1 NST
:::
CCDS56 NST
>>CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 (802 aa)
initn: 328 init1: 152 opt: 486 Z-score: 368.4 bits: 79.0 E(32554): 3.4e-14
Smith-Waterman score: 684; 25.3% identity (53.0% similar) in 834 aa overlap (8-766:8-784)
10 20 30 40 50 60
pF1KA1 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR
: : : :.::. :. : : :.: .. : . : :.: : :.:
CCDS10 MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSG-QAAASQAG
10 20 30 40 50
70 80 90 100 110
pF1KA1 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRER--LLVAVLTSRATLSTLAV
..: .. : ::. : :.: :.:.:.:.. :.: ::
CCDS10 GARGDAR-GAQLWPPGSDPDG---------------GPRDRNFLFVGVMTAQKYLQTRAV
60 70 80 90 100
120 130 140 150 160 170
pF1KA1 AVNRTVAHHFPRLLYFTGQRGARAPAGMQVV-------SHGDERPAWLMSETLRHLHTHF
:. :: .. .: . : ...:. . . . :: :. .. ...: :...: :.
CCDS10 AAYRTWSKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMM---LKYMHDHY
110 120 130 140 150 160
180 190 200 210 220
pF1KA1 GADYDWFFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA----EEFIG--AGEQAR-YCH
:.::. .::.:... :: . :. .. :.::.. : .: : : .. .:
CCDS10 LDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCM
170 180 190 200 210 220
230 240 250 260 270 280
pF1KA1 GGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRS
:: : ..:: .: :. ::. : .. ... : .:::. :: :: ... :: :..
CCDS10 GGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYEN
230 240 250 260 270 280
290 300 310 320 330 340
pF1KA1 FELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-R
.: :. . .: . .:...:: .. .::::. . : : ::... :. :
CCDS10 YEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYM----LSRKISELRHRTIQLHR
290 300 310 320 330
350 360 370 380 390
pF1KA1 NLTVLTPEGEAGL---SWPVGLPAPFT---PHSRFEVLGWDYFTEQHTFSCADGAP-KCP
...... ... . . .:.: : :..: :.: :...: .. .: .:: : .
CCDS10 EIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRG
340 350 360 370 380 390
400 410 420 430 440 450
pF1KA1 LQGASRADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECV
...:.: . : . ..:..: . : :. ... :::: .: : :: :::::
CCDS10 MDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYK
400 410 420 430 440 450
460 470 480 490
pF1KA1 TQRGHRRALA--RRVSLLRPLSRVEILP-------------------MPYVTEATR--VQ
..:.. .. :.. : . .:..... . ..... . :
CCDS10 KHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVP
460 470 480 490 500 510
500 510 520 530
pF1KA1 LVLP---------------LLVAEAAAAPAFLE---AFAANVLEPREHALLTLLLVYGPR
. :: .:. .. :.. : . : : ... :..::
CCDS10 FQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLF----
520 530 540 550 560 570
540 550 560 570 580
pF1KA1 EGGRGAPDPFLGVKAAAAELER----RYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDT
.. . :: :: .:: : .:: . . : : .: :.. ..: :.. ..
CCDS10 -NSDSNPD-----KAKQVELMRDYRIKYPKADMQILPVSGEF-SRALALEVGSSQFNNES
580 590 600 610 620
590 600 610 620 630 640
pF1KA1 LFFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPS
:.:. : : :.::: :.. : : .::. :....: . .: : .
CCDS10 LLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVY---------SGKVPSD
630 640 650 660 670
650 660 670 680 690 700
pF1KA1 PPGADPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAG-ELAGQEEEEALEGLEVMDV
: .. : . . . :.:..: . :..: ... : ::: .:.
CCDS10 NHFAFTQKT----GFWRNYGFGITCIYKGDLV----RVGGFDVSIQGW-----GLEDVDL
680 690 700 710 720
710 720 730 740 750 760
pF1KA1 FLRF--SGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFE
: . .::. ::. : :.:. :.: :. . :. : :. :. ::: .:
CCDS10 FNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLE
730 740 750 760 770 780
770
pF1KA1 QEQANST
.
CCDS10 KNDPSYSKSSNNNGSVRTA
790 800
>>CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 (882 aa)
initn: 466 init1: 147 opt: 444 Z-score: 336.8 bits: 73.3 E(32554): 1.9e-12
Smith-Waterman score: 665; 24.5% identity (55.6% similar) in 738 aa overlap (99-766:170-871)
70 80 90 100 110 120
pF1KA1 KPRIVPYYRDPNKPYKKVLRTRYIQTELGSRERLLVAVLTSRATLSTLAVAVNRTVAHHF
:. : :.:.:.. :.. :.:..:: :. .
CCDS34 GAAGQRRDGRPGSSHNGSGDGGAAAPSARPRDFLYVGVMTAQKYLGSRALAAQRTWARFI
140 150 160 170 180 190
130 140 150 160 170
pF1KA1 P-RLLYFTGQRGARA---PAGMQVV-------SHGDERPAWLMSETLRHLHTHFGADYDW
: :. .:..:. : : . :. :. .. ...: ....: :. :.:
CCDS34 PGRVEFFSSQQPPNAGQPPPPLPVIALPGVDDSYPPQKKSFMM---IKYMHDHYLDKYEW
200 210 220 230 240 250
180 190 200 210 220 230
pF1KA1 FFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA-----EEF--IGAGEQARYCHGGFGYL
:. .::.:... .: . :. .. ::::.. ::. .: .: :: :..
CCDS34 FMRADDDVYIKGDKLEEFLRSLNSSKPLYLGQTGLGNIEELGKLGLEPGENFCMGGPGMI
260 270 280 290 300 310
240 250 260 270 280
pF1KA1 LSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRSFELAKN
.:: .: :. ::. : .. ... : .:::. :. :: ... :: ....: ..
CCDS34 FSREVLRRMVPHIGECLREMYTTHEDVEVGRCVRRFGGTQCVWSYEMQQLFHENYEHNRK
320 330 340 350 360 370
290 300 310 320 330 340
pF1KA1 RDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-RNLTVLT
. .: . .:...:: .. . .::::. . : : ::.. :. :. ....
CCDS34 GYIQDLHNSKIHAAITLHPNKRPAYQYRLHNYM----LSRKISELRYRTIQLHRESALMS
380 390 400 410 420 430
350 360 370 380 390 400
pF1KA1 PEGEAGLS---WPVG-LPA--PFTPHSRFEVLGWDYFTEQHTFSCADGAP-KCPLQGASR
... .: .: .:. : :. : ::. :...: . .: :.. : . :.. :
CCDS34 KLSNTEVSKEDQQLGVIPSFNHFQPRERNEVIEWEFLTGKLLYSAAENQPPRQSLSSILR
440 450 460 470 480 490
410 420 430 440 450
pF1KA1 ADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECVTQRGHR
. . :.. ..:..:. . : :. ... :::: .: .:.:: ::::: ..:..
CCDS34 TALDDTVLQVMEMINENAKSRGRLIDFKEIQYGYRRVNPMHGVEYILDLLLLYKRHKGRK
500 510 520 530 540 550
460 470 480
pF1KA1 RAL-ARRVSLL-----RPLSR-VEILPMPYVTEAT-------------------------
.. .:: . : .:. : .: : . ..:.
CCDS34 LTVPVRRHAYLQQLFSKPFFRETEELDVNSLVESINSETQSFSFISNSLKILSSFQGAKE
560 570 580 590 600 610
490 500 510 520 530 540
pF1KA1 -------RVQLVLPLLVAEAAAAPAFLEAFAANVLEPREHALLTLLLVYGPREGGRGAPD
.:....:: ... :.: : : :.... :...: :..:. .
CCDS34 MGGHNEKKVHILVPL-IGRYDIFLRFMENFENMCLIPKQNVKLVIILF--SRDSGQDSSK
620 630 640 650 660
550 560 570 580 590 600
pF1KA1 PFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPG
. .:. . .:: .... . ...: . : ...: . :::... :
CCDS34 HIELIKG----YQNKYPKAEMTLIPMKGEFSRGLGL-EMASAQFDNDTLLLFCDVDLIFR
670 680 690 700 710 720
610 620 630 640 650 660
pF1KA1 PEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGAPI
. :.::: :.:.: :...:. :....: .. : .::. :. .
CCDS34 EDFLQRCRDNTIQGQQVYYPIIFSQYDPKVT----------NGGNPPTDDYFIFSKKT--
730 740 750 760 770
670 680 690 700 710
pF1KA1 GGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLR--FSGLHLFR
: . . . :.:..: :.: .: . ::: .:.. . .:::. ::
CCDS34 -GFWRDYGYGITCIYKSDLLGA--------GGFDTSIQGWGLEDVDLYNKVILSGLRPFR
780 790 800 810 820
720 730 740 750 760 770
pF1KA1 AVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST
. : :.:. : :.: :. . :. : :. ... ::: .:.
CCDS34 SQEVGVVHIFHPVHCDPNLDPKQYKMCLGSKASTFASTMQLAELWLEKHLGVRYNRTLS
830 840 850 860 870 880
772 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 21:08:53 2016 done: Wed Nov 2 21:08:54 2016
Total Scan time: 4.350 Total Display time: 0.130
Function used was FASTA [36.3.4 Apr, 2011]