FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0990, 802 aa
1>>>pF1KSDA0990 802 - 802 aa - 802 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8690+/-0.000949; mu= 18.4172+/- 0.057
mean_var=87.6029+/-17.741, 0's: 0 Z-trim(106.8): 34 B-trim: 0 in 0/51
Lambda= 0.137030
statistics sampled from 9187 (9210) to 9187 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.644), E-opt: 0.2 (0.283), width: 16
Scan time: 3.890
The best scores are: opt bits E(32554)
CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 ( 802) 5423 1082.6 0
CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 ( 882) 3625 727.2 2.8e-209
CCDS6010.1 CSGALNACT1 gene_id:55790|Hs108|chr8 ( 532) 676 144.1 5.9e-34
CCDS7201.1 CSGALNACT2 gene_id:55454|Hs108|chr10 ( 542) 643 137.6 5.5e-32
CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 ( 772) 486 106.6 1.6e-22
CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 ( 764) 482 105.8 2.8e-22
CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 ( 775) 471 103.7 1.3e-21
CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 ( 613) 427 94.9 4.4e-19
>>CCDS10390.1 CHSY1 gene_id:22856|Hs108|chr15 (802 aa)
initn: 5423 init1: 5423 opt: 5423 Z-score: 5792.3 bits: 1082.6 E(32554): 0
Smith-Waterman score: 5423; 99.9% identity (99.9% similar) in 802 aa overlap (1-802:1-802)
10 20 30 40 50 60
pF1KSD MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSGQAAASQAGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSGQAAASQAGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD ARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTWSKTIPGKVQFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTWSKTIPGKVQFF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD SSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDVYIKGDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDVYIKGDR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD LENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREVLRRMVPHIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREVLRRMVPHIG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD KCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRDLHNSKIHQA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD ITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLHREIVLMSKYSNTEIHKEDLQLGIPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLHREIVLMSKYSNTEIHKEDLQLGIPP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQREALDDIVMQVMEMINANA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQREALDDIVMQVMEMINANA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD KTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPVRRHAYLQQTFSKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPVRRHAYLQQTFSKI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD QFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHKEPKDKKINILIPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHKEPKDKKINILIPL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD SGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMTDYRIKYPKADMQ
::::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::
CCDS10 SGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMRDYRIKYPKADMQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD ILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD SQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLED
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD VDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEM
730 740 750 760 770 780
790 800
pF1KSD WLEKNDPSYSKSSNNNGSVRTA
::::::::::::::::::::::
CCDS10 WLEKNDPSYSKSSNNNGSVRTA
790 800
>>CCDS34223.1 CHSY3 gene_id:337876|Hs108|chr5 (882 aa)
initn: 3732 init1: 2151 opt: 3625 Z-score: 3870.7 bits: 727.2 E(32554): 2.8e-209
Smith-Waterman score: 3642; 68.6% identity (86.4% similar) in 780 aa overlap (30-785:99-872)
10 20 30 40 50
pF1KSD MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGP---RRRAS-PEGCRS--GQA
:.: .. : :::. ::: . :
CCDS34 RPRQEQSPPPARQDLQGPPLPEAAPGITSFRSSPWQQPPPLQQRRRGREPEGATGLPGAP
70 80 90 100 110 120
60 70 80 90
pF1KSD AAS-----QAGGARGDARGAQLWPPGSDP----DGG---P--RDRNFLFVGVMTAQKYLQ
:: . ::: :. : .. :::. ::: : : :.::.::::::::::
CCDS34 AAEGEPEEEDGGAAGQRRDGR---PGSSHNGSGDGGAAAPSARPRDFLYVGVMTAQKYLG
130 140 150 160 170 180
100 110 120 130 140 150
pF1KSD TRAVAAYRTWSKTIPGKVQFFSSE----GSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKY
.::.:: :::.. :::.:.::::. ... :.::. : :::::::::::::::.::
CCDS34 SRALAAQRTWARFIPGRVEFFSSQQPPNAGQPPPPLPVIALPGVDDSYPPQKKSFMMIKY
190 200 210 220 230 240
160 170 180 190 200 210
pF1KSD MHDHYLDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPG
::::::::::::::::::::::::.::.::::::::.::.:::::::. ::.:::.::::
CCDS34 MHDHYLDKYEWFMRADDDVYIKGDKLEEFLRSLNSSKPLYLGQTGLGNIEELGKLGLEPG
250 260 270 280 290 300
220 230 240 250 260 270
pF1KSD ENFCMGGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQ
:::::::::.:.:::::::::::::.:::::::::::::::::::::.:.::::::::::
CCDS34 ENFCMGGPGMIFSREVLRRMVPHIGECLREMYTTHEDVEVGRCVRRFGGTQCVWSYEMQQ
310 320 330 340 350 360
280 290 300 310 320 330
pF1KSD LFYENYEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQLH
::.::::.:.::::.:::::::: :::::::: : ::::::.:::::::::::.::::::
CCDS34 LFHENYEHNRKGYIQDLHNSKIHAAITLHPNKRPAYQYRLHNYMLSRKISELRYRTIQLH
370 380 390 400 410 420
340 350 360 370 380 390
pF1KSD REIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRR
:: .:::: ::::. ::: :::. ::: .::::.:.:..:::::::: ::::...::::.
CCDS34 RESALMSKLSNTEVSKEDQQLGVIPSFNHFQPRERNEVIEWEFLTGKLLYSAAENQPPRQ
430 440 450 460 470 480
400 410 420 430 440 450
pF1KSD GMDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLY
...: : :::: :.::::::: :::.:::.::::::::::::::::.:.::::::::::
CCDS34 SLSSILRTALDDTVLQVMEMINENAKSRGRLIDFKEIQYGYRRVNPMHGVEYILDLLLLY
490 500 510 520 530 540
460 470 480 490 500 510
pF1KSD KKHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLV
:.:::.:.:::::::::::: ::: : : ::::.. :.. ::.:. :.::.::::: :
CCDS34 KRHKGRKLTVPVRRHAYLQQLFSKPFFRETEELDVNSLVESINSETQSFSFISNSLKILS
550 560 570 580 590 600
520 530 540 550 560 570
pF1KSD PFQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSD
:: :.: : ..::..::.:: ::.:.:.::: :::. ::::.::::::..::. :
CCDS34 SFQ--GAK-EMGGHNEKKVHILVPLIGRYDIFLRFMENFENMCLIPKQNVKLVIILFSRD
610 620 630 640 650 660
580 590 600 610 620 630
pF1KSD SNPDKAKQVELMTDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNESLLFFCDVDLV
:. :..:..::. :. :::::.: ..:..:::::.:.::..:.::.:..::.::::::.
CCDS34 SGQDSSKHIELIKGYQNKYPKAEMTLIPMKGEFSRGLGLEMASAQFDNDTLLLFCDVDLI
670 680 690 700 710 720
640 650 660 670 680 690
pF1KSD FTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGKVPSDNHFAFTQKTGFWRNYGFGI
: .:::::: ::. :::.:.::::::::::.. .:. :.:..: :..::::::.::.::
CCDS34 FREDFLQRCRDNTIQGQQVYYPIIFSQYDPKVTNGGNPPTDDYFIFSKKTGFWRDYGYGI
730 740 750 760 770 780
700 710 720 730 740 750
pF1KSD TCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNL
:::::.::. .::::.::::::::::::.:::. .::. ::::::::::. ::: :::::
CCDS34 TCIYKSDLLGAGGFDTSIQGWGLEDVDLYNKVILSGLRPFRSQEVGVVHIFHPVHCDPNL
790 800 810 820 830 840
760 770 780 790 800
pF1KSD DPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA
:::::::::::::::..::.::::.::::.
CCDS34 DPKQYKMCLGSKASTFASTMQLAELWLEKHLGVRYNRTLS
850 860 870 880
>>CCDS6010.1 CSGALNACT1 gene_id:55790|Hs108|chr8 (532 aa)
initn: 650 init1: 331 opt: 676 Z-score: 723.1 bits: 144.1 E(32554): 5.9e-34
Smith-Waterman score: 681; 35.9% identity (69.0% similar) in 306 aa overlap (489-780:208-510)
460 470 480 490 500 510
pF1KSD KGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLS------NSLK
: : : ....:.: :. . .:
CCDS60 DELVEAIESALETLNSPAENSPNHRPYTASDFIEGIYRTERDKGTLYELTFKGDHKHEFK
180 190 200 210 220 230
520 530 540 550 560
pF1KSD KLVPFQLPGS----KSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLV
.:. :. : :.:. . . ::...::. : : : .:: ::.. :. . :.:.
CCDS60 RLILFRPFGPIMKVKNEKLNMANTLINVIVPLAKRVDKFRQFMQNFREMCIEQDGRVHLT
240 250 260 270 280 290
570 580 590 600 610 620
pF1KSD VLLFNSDSNPDKAKQVELMTDYRIKYPKADMQILPVSGEFSRALALEVGSSQFNNES-LL
:. :... . ...: . :. .. .. .. ..:::::. .:.::. ... . ::
CCDS60 VVYFGKE-EINEVKGILENTSKAANF--RNFTFIQLNGEFSRGKGLDVGARFWKGSNVLL
300 310 320 330 340 350
630 640 650 660 670 680
pF1KSD FFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVYSGK--VPS-DNHFAFTQK
::::::. ::.:::. :: :: :.....:..::::.: :.:. . :: ...... ..
CCDS60 FFCDVDIYFTSEFLNTCRLNTQPGKKVFYPVLFSQYNPGIIYGHHDAVPPLEQQLVIKKE
360 370 380 390 400 410
690 700 710 720 730 740
pF1KSD TGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLEDVDLFNKVVQAGLKTFRSQEVGVVH
:::::..:::.:: :..:.. .::::..:.::: ::: :. : ....: . :. :. :
CCDS60 TGFWRDFGFGMTCQYRSDFINIGGFDLDIKGWGGEDVHLYRKYLHSNLIVVRTPVRGLFH
420 430 440 450 460 470
750 760 770 780 790 800
pF1KSD VHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA
. : : .: :.:::::. ::: . .: ::. .
CCDS60 LWHEKRCMDELTPEQYKMCMQSKAMNEASHGQLGMLVFRHEIEAHLRKQKQKTSSKKT
480 490 500 510 520 530
>>CCDS7201.1 CSGALNACT2 gene_id:55454|Hs108|chr10 (542 aa)
initn: 580 init1: 314 opt: 643 Z-score: 687.7 bits: 137.6 E(32554): 5.5e-32
Smith-Waterman score: 643; 35.2% identity (70.7% similar) in 270 aa overlap (516-780:253-519)
490 500 510 520 530 540
pF1KSD EELDAQELAKRINQESGSLSFLSNSLKKLVPF-QLPGSKSEHKEPKDKKINILIPLSGRF
:: : ::: . . :::..::. :
CCDS72 YRTERDKGTQYELFFKKADLTEYRHVTLFRPFGPLMKVKSEMIDITRSIINIIVPLAERT
230 240 250 260 270 280
550 560 570 580 590 600
pF1KSD DMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDSNPDKAKQVELMTDYRIKYPKADMQILPV
. ::.:: ::. .:. .....:.:. :.... .:.:.. . . . .. .. .
CCDS72 EAFVQFMQNFRDVCIHQDKKIHLTVVYFGKEGL-SKVKSI--LESVTSESNFHNYTLVSL
290 300 310 320 330
610 620 630 640 650 660
pF1KSD SGEFSRALALEVGSSQFNN-ESLLFFCDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQY
. ::.:. .:.::. ... : :.::::::. :..:::. :: :. :.....:..:: :
CCDS72 NEEFNRGRGLNVGARAWDKGEVLMFFCDVDIYFSAEFLNSCRLNAEPGKKVFYPVVFSLY
340 350 360 370 380 390
670 680 690 700 710 720
pF1KSD DPKIVYSGKV---PSDNHFAFTQKTGFWRNYGFGITCIYKGDLVRVGGFDVSIQGWGLED
.: :::... : ..... . .::::..:::.:: :..:.. .::::. ..::: ::
CCDS72 NPAIVYANQEVPPPVEQQLVHKKDSGFWRDFGFGMTCQYRSDFLTIGGFDMEVKGWGGED
400 410 420 430 440 450
730 740 750 760 770 780
pF1KSD VDLFNKVVQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEM
: :. : ... : ..:. :. :. : : .: :.::.::. ::: . .: ..:. .
CCDS72 VHLYRKYLHGDLIVIRTPVPGLFHLWHEKRCADELTPEQYRMCIQSKAMNEASHSHLGML
460 470 480 490 500 510
790 800
pF1KSD WLEKNDPSYSKSSNNNGSVRTA
CCDS72 VFREEIETHLHKQAYRTNSEAVG
520 530 540
>>CCDS34779.1 CHPF2 gene_id:54480|Hs108|chr7 (772 aa)
initn: 328 init1: 152 opt: 486 Z-score: 517.7 bits: 106.6 E(32554): 1.6e-22
Smith-Waterman score: 676; 24.9% identity (53.1% similar) in 830 aa overlap (8-784:8-766)
10 20 30 40 50
pF1KSD MAARGRRAWLSVLLGLVLGFVLASRLVLPRASELKRAGPRRRASPEGCRSG-QAAASQAG
: : : :.::. :. : : :.: .. : . : :.: : :.:
CCDS34 MRLSSLLALLRPALPLILGLSLGCSLSLLRVSWIQGEGEDPCVEAVGERGGPQNPDSRAR
10 20 30 40 50 60
60 70 80 90 100
pF1KSD GARGDAR-GAQLWPPGSDPDG---------------GPRDRNFLFVGVMTAQKYLQTRAV
..: .. : ::. : :.: :.:.:.:.. :.: ::
CCDS34 LDQSDEDFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRER--LLVAVLTSRATLSTLAV
70 80 90 100 110
110 120 130 140 150 160
pF1KSD AAYRTWSKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMM---LKYMHDHY
:. :: .. .: . : ...:. . . . :: :. .. ...: :...: :.
CCDS34 AVNRTVAHHFPRLLYFTGQRGARAPAGMQVV-------SHGDERPAWLMSETLRHLHTHF
120 130 140 150 160 170
170 180 190 200 210 220
pF1KSD LDKYEWFMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCM
:.::. .::.:... :: . :. .. :.::.. : .: : : .. .:
CCDS34 GADYDWFFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA----EEFIG--AGEQAR-YCH
180 190 200 210 220
230 240 250 260 270 280
pF1KSD GGPGVIMSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYEN
:: : ..:: .: :. ::. : .. ... : .:::. :: :: ... :: :..
CCDS34 GGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRS
230 240 250 260 270 280
290 300 310 320 330
pF1KSD YEQNKKGYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYM----LSRKISELRHRTIQLHR
.: :. . .: . .:...:: .. .::::. . : : ::... :. :
CCDS34 FELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-R
290 300 310 320 330 340
340 350 360 370 380 390
pF1KSD EIVLMSKYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRG
...... ... . . .:.: : :..: :.: :...: .. .: .:: : .
CCDS34 NLTVLTPEGEAGL---SWPVGLPAP---FTPHSRFEVLGWDYFTEQHTFSCADGAP-KCP
350 360 370 380 390
400 410 420 430 440 450
pF1KSD MDSAQREALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYK
...:.: . : . ..:..: . : :. ... :::: .: : :: :::::
CCDS34 LQGASRADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECV
400 410 420 430 440 450
460 470 480 490 500 510
pF1KSD KHKGKKMTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVP
..:.. .. :.. : . .:..... . ..... . :
CCDS34 TQRGHRRALA--RRVSLLRPLSRVEILP-------------------MPYVTEATR--VQ
460 470 480 490
520 530 540 550 560 570
pF1KSD FQLPGSKSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLF----
. :: .:. .. :.. : . : : ... :..::
CCDS34 LVLP---------------LLVAEAAAAPAFLE---AFAANVLEPREHALLTLLLVYGPR
500 510 520 530
580 590 600 610 620
pF1KSD -NSDSNPDKAKQVELMT-DYRIKYPKADMQILPVSGEF-SRALALEVGSSQFNNESLLFF
.. . :: :. . . . .:: . . : : .: :.. ..: :.. ..:.:.
CCDS34 EGGRGAPDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFL
540 550 560 570 580 590
630 640 650 660 670 680
pF1KSD CDVDLVFTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVY---------SGKVPSDNHFA
: : :.::: :.. : : .::. :....: . .: : . :
CCDS34 TTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGA
600 610 620 630 640 650
690 700 710 720
pF1KSD FTQKT----GFWRNYGFGITCIYKGDLV----RVGGFDVSIQGW-----GLEDVDLFNKV
.. : . . . :.:..: . :..: ... : ::: .:.: .
CCDS34 DPSRGAPIGGRFDRQASAEGCFYNADYLAARARLAG-ELAGQEEEEALEGLEVMDVFLRF
660 670 680 690 700 710
730 740 750 760 770 780
pF1KSD VQAGLKTFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDP
.::. ::. : :.:. :.: :. . :. : :. :. ::: .:.
CCDS34 --SGLHLFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQA
720 730 740 750 760
790 800
pF1KSD SYSKSSNNNGSVRTA
CCDS34 NST
770
>>CCDS64803.1 CHPF2 gene_id:54480|Hs108|chr7 (764 aa)
initn: 328 init1: 152 opt: 482 Z-score: 513.5 bits: 105.8 E(32554): 2.8e-22
Smith-Waterman score: 656; 25.0% identity (54.7% similar) in 741 aa overlap (80-784:89-758)
50 60 70 80 90 100
pF1KSD SGQAAASQAGGARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTW
: :.: :.:.:.:.. :.: :::. ::
CCDS64 DFKPRIVPYYRDPNKPYKKVLRTRYIQTELGSRER--LLVAVLTSRATLSTLAVAVNRTV
60 70 80 90 100 110
110 120 130 140 150 160
pF1KSD SKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMM---LKYMHDHYLDKYEW
.. .: . : ...:. . . . :: :. .. ...: :...: :. :.:
CCDS64 AHHFPRLLYFTGQRGARAPAGMQVV-------SHGDERPAWLMSETLRHLHTHFGADYDW
120 130 140 150 160
170 180 190 200 210 220
pF1KSD FMRADDDVYIKGDRLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVI
:. .::.:... :: . :. .. :.::.. : .: : : .. .: :: : .
CCDS64 FFIMQDDTYVQAPRLAALAGHLSINQDLYLGRA----EEFIG--AGEQAR-YCHGGFGYL
170 180 190 200 210 220
230 240 250 260 270 280
pF1KSD MSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKK
.:: .: :. ::. : .. ... : .:::. :: :: ... :: :...: :.
CCDS64 LSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQ--YRSFELAKN
230 240 250 260 270 280
290 300 310 320 330 340
pF1KSD GYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYM----LSRKISELRHRTIQLHREIVLMS
. .: . .:...:: .. .::::. . : : ::... :. :......
CCDS64 RDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELERAYSEIEQLQAQI-RNLTVLT
290 300 310 320 330
350 360 370 380 390 400
pF1KSD KYSNTEIHKEDLQLGIPPSFMRFQPRQREEILEWEFLTGKYLYSAVDGQPPRRGMDSAQR
... . . .:.: : :..: :.: :...: .. .: .:: : . ...:.:
CCDS64 PEGEAGL---SWPVGLPAPF---TPHSRFEVLGWDYFTEQHTFSCADGAP-KCPLQGASR
340 350 360 370 380 390
410 420 430 440 450 460
pF1KSD EALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKK
. : . ..:..: . : :. ... :::: .: : :: ::::: ..:..
CCDS64 ADVGDALETALEQLNRRYQPRLRFQK-QRLLNGYRRFDPARGMEYTLDLLLECVTQRGHR
400 410 420 430 440 450
470 480 490 500 510 520
pF1KSD MTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGS
.. :.. : . .:..... . ..... . : . ::
CCDS64 RALA--RRVSLLRPLSRVEILP-------------------MPYVTEATR--VQLVLP--
460 470 480
530 540 550 560 570
pF1KSD KSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLF-----NSDSN
.:. .. :.. : . : : ... :..:: .. .
CCDS64 -------------LLVAEAAAAPAFLE---AFAANVLEPREHALLTLLLVYGPREGGRGA
490 500 510 520 530
580 590 600 610 620 630
pF1KSD PDKAKQVELMT-DYRIKYPKADMQILPVSGEF-SRALALEVGSSQFNNESLLFFCDVDLV
:: :. . . . .:: . . : : .: :.. ..: :.. ..:.:. :
CCDS64 PDPFLGVKAAAAELERRYPGTRLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTR
540 550 560 570 580 590
640 650 660 670 680
pF1KSD FTTEFLQRCRANTVLGQQIYFPIIFSQYDPKIVY---------SGKVPSDNHFAFTQKT-
: :.::: :.. : : .::. :....: . .: : . : ..
CCDS64 PGPEVLNRCRMNAISGWQAFFPVHFQEFNPALSPQRSPPGPPGAGPDPPSPPGADPSRGA
600 610 620 630 640 650
690 700 710 720 730
pF1KSD ---GFWRNYGFGITCIYKGDLV----RVGGFDVSIQGW-----GLEDVDLFNKVVQAGLK
: . . . :.:..: . :..: ... : ::: .:.: . .::.
CCDS64 PIGGRFDRQASAEGCFYNADYLAARARLAG-ELAGQEEEEALEGLEVMDVFLRF--SGLH
660 670 680 690 700
740 750 760 770 780 790
pF1KSD TFRSQEVGVVHVHHPVFCDPNLDPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSS
::. : :.:. :.: :. . :. : :. :. ::: .:.
CCDS64 LFRAVEPGLVQKFSLRDCSPRLSEELYHRCRLSNLEGLGGRAQLAMALFEQEQANST
710 720 730 740 750 760
800
pF1KSD NNNGSVRTA
>>CCDS2443.1 CHPF gene_id:79586|Hs108|chr2 (775 aa)
initn: 415 init1: 150 opt: 471 Z-score: 501.7 bits: 103.7 E(32554): 1.3e-21
Smith-Waterman score: 643; 25.9% identity (54.5% similar) in 719 aa overlap (80-784:114-769)
50 60 70 80 90 100
pF1KSD SGQAAASQAGGARGDARGAQLWPPGSDPDGGPRDRNFLFVGVMTAQKYLQTRAVAAYRTW
: :.: :.:.:.:.: : : .::. ::
CCDS24 WEPRVLPYHPAQPGQAAKKAVRTRYISTELGIRQR--LLVAVLTSQTTLPTLGVAVNRTL
90 100 110 120 130 140
110 120 130 140 150 160
pF1KSD SKTIPGKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMR
.. . : . ...: . . :: : : . : . . :... ... : ..::.
CCDS24 GHRLERVVFLTGARGRRAPPGMAVVTL-GEER---PIGHLHLALRHLLEQHGDDFDWFFL
150 160 170 180 190
170 180 190 200 210 220
pF1KSD ADDDVYIKGD---RLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVI
. : .: .. :: . : :: :. :.::. . .: ::. .: :: ::.
CCDS24 VPDTTYTEAHGLARLTGHL-SLASAAHLYLGRP----QDFIGGEPT-PGR-YCHGGFGVL
200 210 220 230 240 250
230 240 250 260 270 280
pF1KSD MSREVLRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKK
.:: .:... ::. : .. ... : .:::. .:: :. ..: . : . : .
CCDS24 LSRMLLQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHE--GVHYSHLELSPG
260 270 280 290 300
290 300 310 320 330 340
pF1KSD GYIRDLHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQ-LHREIVLMSKYS
... . ....:.: :: ..: ..:.::. ..: : .. :: :. :: :. .
CCDS24 EPVQE-GDPHFRSALTAHPVRDPVHMYQLHK-AFARAELERTYQEIQELQWEIQNTSHLA
310 320 330 340 350 360
350 360 370 380 390 400
pF1KSD NTEIHKEDLQLGIP-PSFMRFQPRQREEILEWEFLTGKYLYSAVDGQP--PRRGMDSAQR
. .::: :: .: .: :.:.:...: .. .: .::.: : :: : :
CCDS24 VDGDQAAAWPVGIPAPS----RPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGAD---R
370 380 390 400 410
410 420 430 440 450 460
pF1KSD EALDDIVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKK
. :.. ..: .: . :. ... :::: .: : :: ::: : .: .
CCDS24 ADVADVLGTALEELNRRYHPALRLQK-QQLVNGYRRFDPARGMEYTLDLQLEALTPQGGR
420 430 440 450 460 470
470 480 490 500 510 520
pF1KSD MTVPVRRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGS
:. :.. : . .:..... . :.:.. : :. . . :.: : .
CCDS24 R--PLTRRVQLLRPLSRVEILPVPYVTE---ASRLT----VLLPLAAAERDLAPGFLEAF
480 490 500 510 520
530 540 550 560 570 580
pF1KSD KSEHKEPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDS-NPDKA
. :: : . . : .: : : ... ..: : ::
CCDS24 ATAALEPGDAAAALTLLLL------------YE-----PRQAQRVA----HADVFAPVKA
530 540 550 560
590 600 610 620 630 640
pF1KSD KQVELMTDYRIKYPKADMQILPVSGEFSRALAL-EVGSSQFNNESLLFFCDVDLVFTTEF
. .:: ..: : . : :. : : .. :.. ..:... : :.: .:
CCDS24 HVAELER----RFPGARVPWLSVQTAAPSPLRLMDLLSKKHPLDTLFLLAGPDTVLTPDF
570 580 590 600 610 620
650 660 670 680 690
pF1KSD LQRCRANTVLGQQIYFPIIFSQYDPKIVY-SGKVPSDNHFAFTQKTGFWRNYGFGITCIY
:.::: ... : : .::. :. . : .. .: : . . . :: . . . .:.:
CCDS24 LNRCRMHAISGWQAFFPMHFQAFHPAVAPPQGPGPPE----LGRDTGRFDRQAASEACFY
630 640 650 660 670 680
700 710 720 730 740 750
pF1KSD KGDLVRVGGFDVSIQGWG---LEDVDLFNKVVQ-AGLKTFRSQEVGVVHVHHPVFCDPNL
..: : . : .. . ::..:... .. ..:...:. : .... .. :. :
CCDS24 NSDYVAARGRLAAASEQEEELLESLDVYELFLHFSSLHVLRAVEPALLQRYRAQTCSARL
690 700 710 720 730 740
760 770 780 790 800
pF1KSD DPKQYKMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA
. :. :: : :: ::: . .:.
CCDS24 SEDLYHRCLQSVLEGLGSRTQLAMLLFEQEQGNST
750 760 770
>>CCDS56169.1 CHPF gene_id:79586|Hs108|chr2 (613 aa)
initn: 415 init1: 150 opt: 427 Z-score: 456.1 bits: 94.9 E(32554): 4.4e-19
Smith-Waterman score: 599; 25.4% identity (54.3% similar) in 654 aa overlap (145-784:11-607)
120 130 140 150 160 170
pF1KSD GKVQFFSSEGSDTSVPIPVVPLRGVDDSYPPQKKSFMMLKYMHDHYLDKYEWFMRADDDV
: . . :... ... : ..::. . : .
CCDS56 MAVVTLGEERPIGHLHLALRHLLEQHGDDFDWFFLVPDTT
10 20 30 40
180 190 200 210 220 230
pF1KSD YIKGD---RLENFLRSLNSSEPLFLGQTGLGTTEEMGKLALEPGENFCMGGPGVIMSREV
: .. :: . : :: :. :.::. . .: ::. .: :: ::..:: .
CCDS56 YTEAHGLARLTGHL-SLASAAHLYLGRP----QDFIGGEPT-PGR-YCHGGFGVLLSRML
50 60 70 80 90
240 250 260 270 280 290
pF1KSD LRRMVPHIGKCLREMYTTHEDVEVGRCVRRFAGVQCVWSYEMQQLFYENYEQNKKGYIRD
:... ::. : .. ... : .:::. .:: :. ..: . : . : . ...
CCDS56 LQQLRPHLEGCRNDIVSARPDEWLGRCILDATGVGCTGDHE--GVHYSHLELSPGEPVQE
100 110 120 130 140 150
300 310 320 330 340 350
pF1KSD LHNSKIHQAITLHPNKNPPYQYRLHSYMLSRKISELRHRTIQ-LHREIVLMSKYSNTEIH
. ....:.: :: ..: ..:.::. ..: : .. :: :. :: :. . .
CCDS56 -GDPHFRSALTAHPVRDPVHMYQLHK-AFARAELERTYQEIQELQWEIQNTSHLAVDGDQ
160 170 180 190 200
360 370 380 390 400
pF1KSD KEDLQLGIP-PSFMRFQPRQREEILEWEFLTGKYLYSAVDGQP--PRRGMDSAQREALDD
.::: :: .: .: :.:.:...: .. .: .::.: : :: : : . :
CCDS56 AAAWPVGIPAPS----RPASRFEVLRWDYFTEQHAFSCADGSPRCPLRGAD---RADVAD
210 220 230 240 250 260
410 420 430 440 450 460
pF1KSD IVMQVMEMINANAKTRGRIIDFKEIQYGYRRVNPMYGAEYILDLLLLYKKHKGKKMTVPV
.. ..: .: . :. ... :::: .: : :: ::: : .: . :.
CCDS56 VLGTALEELNRRYHPALRLQK-QQLVNGYRRFDPARGMEYTLDLQLEALTPQGGRR--PL
270 280 290 300 310
470 480 490 500 510 520
pF1KSD RRHAYLQQTFSKIQFVEHEELDAQELAKRINQESGSLSFLSNSLKKLVPFQLPGSKSEHK
:.. : . .:..... . :.:.. : :. . . :.: : . .
CCDS56 TRRVQLLRPLSRVEILPVPYVTE---ASRLT----VLLPLAAAERDLAPGFLEAFATAAL
320 330 340 350 360 370
530 540 550 560 570 580
pF1KSD EPKDKKINILIPLSGRFDMFVRFMGNFEKTCLIPNQNVKLVVLLFNSDS-NPDKAKQVEL
:: : . . : .: : : ... ..: : ::. .::
CCDS56 EPGDAAAALTLLLL------------YE-----PRQAQRVA----HADVFAPVKAHVAEL
380 390 400 410
590 600 610 620 630 640
pF1KSD MTDYRIKYPKADMQILPVSGEFSRALAL-EVGSSQFNNESLLFFCDVDLVFTTEFLQRCR
..: : . : :. : : .. :.. ..:... : :.: .::.:::
CCDS56 ER----RFPGARVPWLSVQTAAPSPLRLMDLLSKKHPLDTLFLLAGPDTVLTPDFLNRCR
420 430 440 450 460
650 660 670 680 690 700
pF1KSD ANTVLGQQIYFPIIFSQYDPKIVY-SGKVPSDNHFAFTQKTGFWRNYGFGITCIYKGDLV
... : : .::. :. . : .. .: : . . . :: . . . .:.:..: :
CCDS56 MHAISGWQAFFPMHFQAFHPAVAPPQGPGPPE----LGRDTGRFDRQAASEACFYNSDYV
470 480 490 500 510 520
710 720 730 740 750 760
pF1KSD RVGGFDVSIQGWG---LEDVDLFNKVVQ-AGLKTFRSQEVGVVHVHHPVFCDPNLDPKQY
. : .. . ::..:... .. ..:...:. : .... .. :. :. :
CCDS56 AARGRLAAASEQEEELLESLDVYELFLHFSSLHVLRAVEPALLQRYRAQTCSARLSEDLY
530 540 550 560 570 580
770 780 790 800
pF1KSD KMCLGSKASTYGSTQQLAEMWLEKNDPSYSKSSNNNGSVRTA
. :: : :: ::: . .:.
CCDS56 HRCLQSVLEGLGSRTQLAMLLFEQEQGNST
590 600 610
802 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 18:56:36 2016 done: Thu Nov 3 18:56:37 2016
Total Scan time: 3.890 Total Display time: 0.170
Function used was FASTA [36.3.4 Apr, 2011]