FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1563, 1657 aa
1>>>pF1KSDA1563 1657 - 1657 aa - 1657 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1543+/-0.00111; mu= 19.5150+/- 0.067
mean_var=81.1532+/-16.005, 0's: 0 Z-trim(104.0): 62 B-trim: 62 in 1/50
Lambda= 0.142371
statistics sampled from 7628 (7690) to 7628 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.589), E-opt: 0.2 (0.236), width: 16
Scan time: 5.200
The best scores are: opt bits E(32554)
CCDS42800.1 ALS2 gene_id:57679|Hs108|chr2 (1657) 11064 2283.4 0
CCDS46492.1 ALS2 gene_id:57679|Hs108|chr2 ( 396) 2456 515.1 1.8e-145
CCDS2743.1 ALS2CL gene_id:259173|Hs108|chr3 ( 953) 1213 260.0 2.8e-68
CCDS34598.1 RSPH10B gene_id:222967|Hs108|chr7 ( 870) 348 82.3 7.9e-15
CCDS43552.1 RSPH10B2 gene_id:728194|Hs108|chr7 ( 870) 348 82.3 7.9e-15
CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 298 71.9 4.6e-12
CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 298 72.1 1.2e-11
CCDS72688.1 MORN1 gene_id:79906|Hs108|chr1 ( 350) 287 69.6 2.1e-11
CCDS40.1 MORN1 gene_id:79906|Hs108|chr1 ( 497) 287 69.7 2.9e-11
CCDS10021.1 HERC2 gene_id:8924|Hs108|chr15 (4834) 301 72.9 2.9e-11
>>CCDS42800.1 ALS2 gene_id:57679|Hs108|chr2 (1657 aa)
initn: 11064 init1: 11064 opt: 11064 Z-score: 12270.7 bits: 2283.4 E(32554): 0
Smith-Waterman score: 11064; 99.9% identity (100.0% similar) in 1657 aa overlap (1-1657:1-1657)
10 20 30 40 50 60
pF1KSD MDSKKRSSTEAEGSKERGLVHIWQAGSFPITPERLPGWGGKTVLQAALGVKHGVLLTEDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MDSKKRSSTEAEGSKERGLVHIWQAGSFPITPERLPGWGGKTVLQAALGVKHGVLLTEDG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD EVYSFGTLPWRSGPVEICPSSPILENALVGQYVITVATGSFHSGAVTDNGVAYMWGENSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EVYSFGTLPWRSGPVEICPSSPILENALVGQYVITVATGSFHSGAVTDNGVAYMWGENSA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD GQCAVANQQYVPEPNPVSIADSEASPLLAVRILQLACGEEHTLALSISREIWAWGTGCQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GQCAVANQQYVPEPNPVSIADSEASPLLAVRILQLACGEEHTLALSISREIWAWGTGCQL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD GLITTAFPVTKPQKVEHLAGRVVLQVACGAFHSLALVQCLPSQDLKPVPERCNQCSQLLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GLITTAFPVTKPQKVEHLAGRVVLQVACGAFHSLALVQCLPSQDLKPVPERCNQCSQLLI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD TMTDKEDHVIISDSHCCPLGVTLTESQAENHASTALSPSTETLDRQEEVFENTLVANDQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TMTDKEDHVIISDSHCCPLGVTLTESQAENHASTALSPSTETLDRQEEVFENTLVANDQS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VATELNAVSAQITSSDAMSSQQNVMGTTEISSARNIPSYPDTQAVNEYLRKLSDHSVRED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VATELNAVSAQITSSDAMSSQQNVMGTTEISSARNIPSYPDTQAVNEYLRKLSDHSVRED
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SEHGEKPMPSQPLLEEAIPNLHSPPTTSTSALNSLVVSCASAVGVRVAATYEAGALSLKK
:::::::.::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SEHGEKPVPSQPLLEEAIPNLHSPPTTSTSALNSLVVSCASAVGVRVAATYEAGALSLKK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD VMNFYSTTPCETGAQAGSSAIGPEGLKDSREEQVKQESMQGKKSSSLVDIREEETEGGSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VMNFYSTTPCETGAQAGSSAIGPEGLKDSREEQVKQESMQGKKSSSLVDIREEETEGGSR
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD RLSLPGLLSQVSPRLLRKAARVKTRTVVLTPTYSGEADALLPSLRTEVWTWGKGKEGQLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RLSLPGLLSQVSPRLLRKAARVKTRTVVLTPTYSGEADALLPSLRTEVWTWGKGKEGQLG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD HGDVLPRLQPLCVKCLDGKEVIHLEAGGYHSLALTAKSQVYSWGSNTFGQLGHSDFPTTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 HGDVLPRLQPLCVKCLDGKEVIHLEAGGYHSLALTAKSQVYSWGSNTFGQLGHSDFPTTV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD PRLAKISSENGVWSIAAGRDYSLFLVDTEDFQPGLYYSGRQDPTEGDNLPENHSGSKTPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PRLAKISSENGVWSIAAGRDYSLFLVDTEDFQPGLYYSGRQDPTEGDNLPENHSGSKTPV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD LLSCSKLGYISRVTAGKDSYLALVDKNIMGYIASLHELATTERRFYSKLSDIKSQILRPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LLSCSKLGYISRVTAGKDSYLALVDKNIMGYIASLHELATTERRFYSKLSDIKSQILRPL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD LSLENLGTTTTVQLLQEVASRFSKLCYLIGQHGASLSSFLHGVKEARSLVILKHSSLFLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LSLENLGTTTTVQLLQEVASRFSKLCYLIGQHGASLSSFLHGVKEARSLVILKHSSLFLD
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD SYTEYCTSITNFLVMGGFQLLAKPAIDFLNKNQELLQDLSEVNDENTQLMEILNTLFFLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SYTEYCTSITNFLVMGGFQLLAKPAIDFLNKNQELLQDLSEVNDENTQLMEILNTLFFLP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD IRRLHNYAKVLLKLATCFEVASPEYQKLQDSSSCYECLALHLGRKRKEAEYTLGFWKTFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IRRLHNYAKVLLKLATCFEVASPEYQKLQDSSSCYECLALHLGRKRKEAEYTLGFWKTFP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD GKMTDSLRKPERRLLCESSNRALSLQHAGRFSVNWFILFNDALVHAQFSTHHVFPLATLW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GKMTDSLRKPERRLLCESSNRALSLQHAGRFSVNWFILFNDALVHAQFSTHHVFPLATLW
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD AEPLSEEAGGVNGLKITTPEEQFTLISSTPQEKTKWLRAISQAVDQALRGMSDLPPYGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 AEPLSEEAGGVNGLKITTPEEQFTLISSTPQEKTKWLRAISQAVDQALRGMSDLPPYGSG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD SSVQRQEPPISRSAKYTFYKDPRLKDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFRNGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SSVQRQEPPISRSAKYTFYKDPRLKDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFRNGL
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD EDGYGEYRIPNKAMNKEDHYVGHWKEGKMCGQGVYSYASGEVFEGCFQDNMRHGHGLLRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EDGYGEYRIPNKAMNKEDHYVGHWKEGKMCGQGVYSYASGEVFEGCFQDNMRHGHGLLRS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD GKLTSSSPSMFIGQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNGVVVTQFGLYYEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GKLTSSSPSMFIGQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNGVVVTQFGLYYEG
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD NFHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIEGYFSGEWGSGIKIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NFHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIEGYFSGEWGSGIKIT
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD GTYFKPSLYESDKDRPKVFRKLGNLAVPADEKWKAVFDECWRQLGCEGPGQGEVWKAWDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GTYFKPSLYESDKDRPKVFRKLGNLAVPADEKWKAVFDECWRQLGCEGPGQGEVWKAWDN
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD IAVALTTSRRQHRDSPEILSRSQTQTLESLEFIPQHVGAFSVEKYDDIRKYLIKACDTPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IAVALTTSRRQHRDSPEILSRSQTQTLESLEFIPQHVGAFSVEKYDDIRKYLIKACDTPL
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KSD HPLGRLVETLVAVYRMTYVGVGANRRLLQEAVKEIKSYLKRIFQLVRFLFPELPEEGSTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 HPLGRLVETLVAVYRMTYVGVGANRRLLQEAVKEIKSYLKRIFQLVRFLFPELPEEGSTI
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KSD PLSAPLPTERKSFCTGKSDSRSESPEPGYVVTSSGLLLPVLLPRLYPPLFMLYALDNDRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PLSAPLPTERKSFCTGKSDSRSESPEPGYVVTSSGLLLPVLLPRLYPPLFMLYALDNDRE
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KSD EDIYWECVLRLNKQPDIALLGFLGVQRKFWPATLSILGESKKVLPTTKDACFASAVECLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EDIYWECVLRLNKQPDIALLGFLGVQRKFWPATLSILGESKKVLPTTKDACFASAVECLQ
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KSD QISTTFTPSDKLKVIQQTFEEISQSVLASLHEDFLWSMDDLFPVFLYVVLRARIRNLGSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 QISTTFTPSDKLKVIQQTFEEISQSVLASLHEDFLWSMDDLFPVFLYVVLRARIRNLGSE
1570 1580 1590 1600 1610 1620
1630 1640 1650
pF1KSD VHLIEDLMDPYLQHGEQGIMFTTLKACYYQIQREKLN
:::::::::::::::::::::::::::::::::::::
CCDS42 VHLIEDLMDPYLQHGEQGIMFTTLKACYYQIQREKLN
1630 1640 1650
>>CCDS46492.1 ALS2 gene_id:57679|Hs108|chr2 (396 aa)
initn: 2456 init1: 2456 opt: 2456 Z-score: 2725.0 bits: 515.1 E(32554): 1.8e-145
Smith-Waterman score: 2456; 99.7% identity (100.0% similar) in 371 aa overlap (1-371:1-371)
10 20 30 40 50 60
pF1KSD MDSKKRSSTEAEGSKERGLVHIWQAGSFPITPERLPGWGGKTVLQAALGVKHGVLLTEDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MDSKKRSSTEAEGSKERGLVHIWQAGSFPITPERLPGWGGKTVLQAALGVKHGVLLTEDG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD EVYSFGTLPWRSGPVEICPSSPILENALVGQYVITVATGSFHSGAVTDNGVAYMWGENSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 EVYSFGTLPWRSGPVEICPSSPILENALVGQYVITVATGSFHSGAVTDNGVAYMWGENSA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD GQCAVANQQYVPEPNPVSIADSEASPLLAVRILQLACGEEHTLALSISREIWAWGTGCQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GQCAVANQQYVPEPNPVSIADSEASPLLAVRILQLACGEEHTLALSISREIWAWGTGCQL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD GLITTAFPVTKPQKVEHLAGRVVLQVACGAFHSLALVQCLPSQDLKPVPERCNQCSQLLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GLITTAFPVTKPQKVEHLAGRVVLQVACGAFHSLALVQCLPSQDLKPVPERCNQCSQLLI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD TMTDKEDHVIISDSHCCPLGVTLTESQAENHASTALSPSTETLDRQEEVFENTLVANDQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 TMTDKEDHVIISDSHCCPLGVTLTESQAENHASTALSPSTETLDRQEEVFENTLVANDQS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VATELNAVSAQITSSDAMSSQQNVMGTTEISSARNIPSYPDTQAVNEYLRKLSDHSVRED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VATELNAVSAQITSSDAMSSQQNVMGTTEISSARNIPSYPDTQAVNEYLRKLSDHSVRED
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SEHGEKPMPSQPLLEEAIPNLHSPPTTSTSALNSLVVSCASAVGVRVAATYEAGALSLKK
:::::::.:::
CCDS46 SEHGEKPVPSQVPAQFYKIKVCLELNCMGFSLETLK
370 380 390
>>CCDS2743.1 ALS2CL gene_id:259173|Hs108|chr3 (953 aa)
initn: 1424 init1: 450 opt: 1213 Z-score: 1339.2 bits: 260.0 E(32554): 2.8e-68
Smith-Waterman score: 1779; 34.3% identity (63.6% similar) in 973 aa overlap (698-1656:9-938)
670 680 690 700 710 720
pF1KSD GYISRVTAGKDSYLALVDKNIMGYIASLHELATTERRFYSKLSDIKSQILRPLLSLENLG
: :. : . :. ..: .:.:::
CCDS27 MCNPEEAALLRLEEVFSATLAHVNSLVLQPLLPAAPDP
10 20 30
730 740 750 760 770 780
pF1KSD TTT----TVQLLQEVASRFSKLCYLIGQHGASLSSFLHGVKEA--RSLVILKHSSLFLDS
. ..:::.. . ..: . . ::. :. . .::..:. .. :..
CCDS27 SDPWGRECLRLLQQLHKSSQQLWEVTEESLHSLQERLRYPDSTGLESLLLLRGADRVLQA
40 50 60 70 80 90
790 800 810 820 830 840
pF1KSD YTEYCTSITNFLVMGGFQLLAKPAIDFL-NKNQELLQDLSEVNDENTQLMEILNTLFFLP
. :: : :. .:. .:: :: .. .. . : : :: :..:.. . :. . :
CCDS27 HIEYIESYTSCMVVQAFQKAAKRRSEYWRGQRKALRQLLSGVSSEGS-VGASLGQALHQP
100 110 120 130 140 150
850 860 870 880 890
pF1KSD I-RRLHNYAKVLLKLATCFEVASPEYQKLQDSSSCYECLALHLGRKRKEAEYTLGFWKTF
. .....:. .::.:. . : . . .. . . : . .. .: : ..:.:.
CCDS27 LAHHVQQYVLLLLSLGDTIGEHHPTRELVVNAVTLFGNLQSFMKQELDQAVATQALWHTL
160 170 180 190 200 210
900 910 920 930 940 950
pF1KSD PGKMTDSLRKPERRLLCESSNRALSLQHAGRFSVNWFILFNDALVHAQFSTHHVFPLATL
:.. : : : .::: .:.. ... . . .. .::.:::: : . :.: : .
CCDS27 RGRLRDVLCTPAHRLLQDSQDVPVTV---APLRAERVLLFDDALVLLQGHNVHTFDLKLV
220 230 240 250 260 270
960 970 980 990 1000 1010
pF1KSD WAEPLSEEAGGVNG--LKITTPEEQFTLISSTPQEKTKWLRAISQAVDQALRGMSDLPPY
:..: : .: ... ::::.:.. .. : .. : .. :: :::.: .:.:
CCDS27 WVDP------GQDGCTFHLLTPEEEFSFCAKDSQGQAVWQWKVTWAVHQALHGKKDFPVL
280 290 300 310 320
1020 1030 1040 1050 1060 1070
pF1KSD GSGSSVQRQEPPISRSAKYTFYKDPRLKDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFR
:.: .. ..:: : :.::: . :: .:::.:.: :.:::.:.::::::. . : :
CCDS27 GAG--LEPSQPPDCRCAEYTFQAEGRLCQATYEGEWCRGRPHGKGTLKWPDGRNHVGNFC
330 340 350 360 370 380
1080 1090 1100 1110 1120 1130
pF1KSD NGLEDGYGEYRIPNKAMNKEDHYVGHWKEGKMCGQGVYSYASGEVFEGCFQDNMRHGHGL
.::: :.: .:. . .: : : ::.::.::: :. :.. ::..: ::...::: :.
CCDS27 QGLEHGFGIRLLPQASEDKFDCYKCHWREGSMCGYGICEYSTDEVYKGYFQEGLRHGFGV
390 400 410 420 430 440
1140 1150 1160 1170 1180 1190
pF1KSD LRSGKLTSSSPSMFIGQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNGVVVTQFGLY
:.:: . .: . :.: ...:::. .: :::.:.:::: .: ::.::: :.
CCDS27 LESGP-QAPQPFRYTGHWERGQRSGYGIEEDGDRGERYIGMWQAGQRHGPGVMVTQAGVC
450 460 470 480 490 500
1200 1210 1220 1230 1240 1250
pF1KSD YEGNFHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIEGYFSGEWGSGI
:.:.:. .: .: :.::::::..::: :. : :: ::: .:.::: .:: :.. : :.
CCDS27 YQGTFQADKTVGPGILLSEDDSLYEGTFTRDLTLMGKGKVTFPNGFTLEGSFGSGAGRGL
510 520 530 540 550 560
1260 1270 1280 1290 1300 1310
pF1KSD KITGTYFKPSLYESDKDRPKVFRKLGNLAVPADEKWKAVFDECWRQLGCEGPGQGEVWKA
. :. .: . .. : :.:: : :.. .:..:.. .:.. : : . .. .:
CCDS27 HTQGVLDTAALPPDPSSTCK--RQLGVGAFPVESRWQGVYSP-FRDFVCAGCPR-DLQEA
570 580 590 600 610 620
1320 1330 1340 1350 1360 1370
pF1KSD WDNIAVALTTSRRQHRDSPEILSRSQTQ---TLESLEFIPQHVGAFSVEKYDDIRKYLIK
.. : : :. : : . :: .:. .. :.: : ... : .. :: :
CCDS27 LLGFDV---QSSRELRRSQDYLSCERTHPEDSVGSMEDILEELLQHREPKA--LQLYLRK
630 640 650 660 670
1380 1390 1400 1410 1420 1430
pF1KSD ACDTPLHPLGRLVETLVAVYRMTYVGVGANRRLLQEAVKEIKSYLKRIFQLVRFLFPELP
: .. :::::.:..::. ... ::.:::::..: . : .:.:.. .... : :
CCDS27 ALSNSLHPLGKLLRTLMLTFQATYAGVGANKHLQELAQEEVKQHAQELWAAYRGL-----
680 690 700 710 720 730
1440 1450 1460 1470 1480 1490
pF1KSD EEGSTIPLSAPLPTERKSFCTGKSDSRSESPEPGYVVTSSGLLLPVLLPRLYPPLFMLYA
: . : ::: :.. ..:. : . ::.::..:: .: :: ::
CCDS27 -------LRVAL--ERK----GQALEEDEDTET-RDLQVHGLVLPLMLPSFYSELFTLYL
740 750 760 770
1500 1510 1520 1530 1540 1550
pF1KSD LDNDREEDIYWECVLRLNKQPDIALLGFLGVQRKFWP-ATLSILGESKKVLPTTKDACFA
: ..::...: . . :. :: :: :: ::...:: :.. .... : ..: ::
CCDS27 LLHEREDSFYSQGIANLSLFPDTQLLEFLDVQKHLWPLKDLTLTSNQRYSL--VRDKCFL
780 790 800 810 820 830
1560 1570 1580 1590 1600 1610
pF1KSD SAVECLQQISTTFTPSDKLKVIQQTFEEISQSVLASLHEDFLWSMDDLFPVFLYVVLRAR
::.::::.: :: : .::.:...:. :: .: : ... ::::.:...::: :::
CCDS27 SATECLQKIMTTVDPREKLEVLERTYGEIEGTVSRVLGREYKLPMDDLLPLLIYVVSRAR
840 850 860 870 880 890
1620 1630 1640 1650
pF1KSD IRNLGSEVHLIEDLMDPYLQHGEQGIMFTTLKACYYQIQREKLN
:..::.:.:::.:.::: : ...:.:..:: .::.: .
CCDS27 IQHLGAEIHLIRDMMDPNHTGGLYDFLLTALESCYEHIQKEDMRLHRLPGHWHSRELW
900 910 920 930 940 950
>>CCDS34598.1 RSPH10B gene_id:222967|Hs108|chr7 (870 aa)
initn: 293 init1: 153 opt: 348 Z-score: 379.6 bits: 82.3 E(32554): 7.9e-15
Smith-Waterman score: 348; 29.5% identity (55.3% similar) in 244 aa overlap (1049-1280:132-365)
1020 1030 1040 1050 1060 1070
pF1KSD SGSSVQRQEPPISRSAKYTFYKDPRLKDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFRN
:.: .... : ..:: ::::.:: : :
CCDS34 AFQGGCTYRGMFSEGLMHGQGTYIWADGLKYEGDFVKNVPMNHGVYTWPDGSMYEGEVVN
110 120 130 140 150 160
1080 1090 1100 1110 1120 1130
pF1KSD GLEDGYGEYRIPNKAMNKEDHYVGHWKEGKMCGQG-VYSYASGEV-FEGCFQDNMRHGHG
:...:.: .. .. .. :.::: .:: :.: .: : .:: . .:...: :
CCDS34 GMRNGFGMFKCSTQPVS----YIGHWCNGKRHGKGSIYYNQEGTCWYEGDWVQNIKKGWG
170 180 190 200 210
1140 1150 1160 1170 1180
pF1KSD LLRSGKLTSSSPSMFIGQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNG--------
. : : : ... ::: . . : : . .: .:.: : :. . .: :
CCDS34 I-RCYK----SGNIYEGQWEDNMRHGEGRMRWLTTNEEYTGRWERGIQNGFGTHTWFLKR
220 230 240 250 260 270
1190 1200 1210 1220 1230 1240
pF1KSD VVVTQFGLYYE--GNFHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIE
. .:. : : :.: . : : . . ..:.::. .. : : ::. :: :
CCDS34 IRSSQYPLRNEYIGEFVNGYRHGRGKFYYASGAMYDGEWVSN-KKHGMGRLTFKNGRVYE
280 290 300 310 320 330
1250 1260 1270 1280 1290 1300
pF1KSD GYFSGEWGSGIKITGTYFKPSLYESDKDRPKVFRKLGNLAVPADEKWKAVFDECWRQLGC
: ::.. .:. . : : :. :.. :
CCDS34 GAFSNDHIAGFPDLEVEFISCLDLSSGVAPRLSRSAELIRKLDGSESHSVLGSSIELDLN
340 350 360 370 380 390
1310 1320 1330 1340 1350 1360
pF1KSD EGPGQGEVWKAWDNIAVALTTSRRQHRDSPEILSRSQTQTLESLEFIPQHVGAFSVEKYD
CCDS34 LLLDMYPETVQPEEKKQVEYAVLRNITELRRIYSFYSSLGCGHSLDNTFLMTKLHFWRFL
400 410 420 430 440 450
>>CCDS43552.1 RSPH10B2 gene_id:728194|Hs108|chr7 (870 aa)
initn: 293 init1: 153 opt: 348 Z-score: 379.6 bits: 82.3 E(32554): 7.9e-15
Smith-Waterman score: 348; 29.5% identity (55.3% similar) in 244 aa overlap (1049-1280:132-365)
1020 1030 1040 1050 1060 1070
pF1KSD SGSSVQRQEPPISRSAKYTFYKDPRLKDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFRN
:.: .... : ..:: ::::.:: : :
CCDS43 AFQGGCTYRGMFSEGLMHGQGTYIWADGLKYEGDFVKNVPMNHGVYTWPDGSMYEGEVVN
110 120 130 140 150 160
1080 1090 1100 1110 1120 1130
pF1KSD GLEDGYGEYRIPNKAMNKEDHYVGHWKEGKMCGQG-VYSYASGEV-FEGCFQDNMRHGHG
:...:.: .. .. .. :.::: .:: :.: .: : .:: . .:...: :
CCDS43 GMRNGFGMFKCSTQPVS----YIGHWCNGKRHGKGSIYYNQEGTCWYEGDWVQNIKKGWG
170 180 190 200 210
1140 1150 1160 1170 1180
pF1KSD LLRSGKLTSSSPSMFIGQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNG--------
. : : : ... ::: . . : : . .: .:.: : :. . .: :
CCDS43 I-RCYK----SGNIYEGQWEDNMRHGEGRMRWLTTNEEYTGRWERGIQNGFGTHTWFLKR
220 230 240 250 260 270
1190 1200 1210 1220 1230 1240
pF1KSD VVVTQFGLYYE--GNFHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIE
. .:. : : :.: . : : . . ..:.::. .. : : ::. :: :
CCDS43 IRSSQYPLRNEYIGEFVNGYRHGRGKFYYASGAMYDGEWVSN-KKHGMGRLTFKNGRVYE
280 290 300 310 320 330
1250 1260 1270 1280 1290 1300
pF1KSD GYFSGEWGSGIKITGTYFKPSLYESDKDRPKVFRKLGNLAVPADEKWKAVFDECWRQLGC
: ::.. .:. . : : :. :.. :
CCDS43 GAFSNDHIAGFPDLEVEFISCLDLSSGVAPRLSRSAELIRKLDGSESHSVLGSSIELDLN
340 350 360 370 380 390
1310 1320 1330 1340 1350 1360
pF1KSD EGPGQGEVWKAWDNIAVALTTSRRQHRDSPEILSRSQTQTLESLEFIPQHVGAFSVEKYD
CCDS43 LLLDMYPETVQPEEKKQVEYAVLRNITELRRIYSFYSSLGCGHSLDNTFLMTKLHFWRFL
400 410 420 430 440 450
>>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa)
initn: 516 init1: 170 opt: 298 Z-score: 330.0 bits: 71.9 E(32554): 4.6e-12
Smith-Waterman score: 298; 35.6% identity (62.2% similar) in 180 aa overlap (41-216:34-205)
20 30 40 50 60 70
pF1KSD AEGSKERGLVHIWQAGSFPITPERLPGWGGKTVLQAALGVKHGVLLTEDGEVYSFGTLPW
..: ..: : .:.:.: ::::::. :
CCDS82 WGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGLNTK
10 20 30 40 50 60
80 90 100 110 120
pF1KSD RSGPVEICPSSPILENALVGQYVITVATGSFHSGAVTDNGVAYMWGENSAGQCAV-ANQQ
. : ..: .::. :..: :: : :: :..: : . :: .: :: .. ....
CCDS82 GQLGHEREGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMTTED
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD YVPEPNPVSIADSEASPLLAVRILQLACGEEHTLALSISREIWAWGTGC--QLGLITTAF
: : .. .... :::..::. : :::. . ....:: . :::: :
CCDS82 SVAVPRLIQKLNQQT-------ILQVSCGNWHCLALAADGQFFTWGKNSHGQLGL-GKEF
130 140 150 160 170
190 200 210 220 230 240
pF1KSD PV-TKPQKVEHLAGRVVLQVACGAFHSLALVQCLPSQDLKPVPERCNQCSQLLITMTDKE
: ..::.:. : : . ::: :. ::.::
CCDS82 PSQASPQRVRSLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCH
180 190 200 210 220 230
>>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa)
initn: 516 init1: 170 opt: 298 Z-score: 322.9 bits: 72.1 E(32554): 1.2e-11
Smith-Waterman score: 298; 35.6% identity (62.2% similar) in 180 aa overlap (41-216:34-205)
20 30 40 50 60 70
pF1KSD AEGSKERGLVHIWQAGSFPITPERLPGWGGKTVLQAALGVKHGVLLTEDGEVYSFGTLPW
..: ..: : .:.:.: ::::::. :
CCDS34 WGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACGGNHSVFLLEDGEVYTCGLNTK
10 20 30 40 50 60
80 90 100 110 120
pF1KSD RSGPVEICPSSPILENALVGQYVITVATGSFHSGAVTDNGVAYMWGENSAGQCAV-ANQQ
. : ..: .::. :..: :: : :: :..: : . :: .: :: .. ....
CCDS34 GQLGHEREGNKPEQIGALADQHIIHVACGESHSLALSDRGQLFSWGAGSDGQLGLMTTED
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD YVPEPNPVSIADSEASPLLAVRILQLACGEEHTLALSISREIWAWGTGC--QLGLITTAF
: : .. .... :::..::. : :::. . ....:: . :::: :
CCDS34 SVAVPRLIQKLNQQT-------ILQVSCGNWHCLALAADGQFFTWGKNSHGQLGL-GKEF
130 140 150 160 170
190 200 210 220 230 240
pF1KSD PV-TKPQKVEHLAGRVVLQVACGAFHSLALVQCLPSQDLKPVPERCNQCSQLLITMTDKE
: ..::.:. : : . ::: :. ::.::
CCDS34 PSQASPQRVRSLEGIPLAQVAAGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCH
180 190 200 210 220 230
>>CCDS72688.1 MORN1 gene_id:79906|Hs108|chr1 (350 aa)
initn: 105 init1: 105 opt: 287 Z-score: 318.2 bits: 69.6 E(32554): 2.1e-11
Smith-Waterman score: 289; 31.4% identity (56.7% similar) in 210 aa overlap (1018-1201:7-209)
990 1000 1010 1020 1030 1040
pF1KSD STPQEKTKWLRAISQAVDQALRGMSDLPPYGSGSSV-QRQEPPISRSAK--YTFYKDPRL
:. :: :..:: : . : : :
CCDS72 MAAAGEGTPSSRGPRRDPP-RRPPRNGYGVYVYPN-
10 20 30
1050 1060 1070 1080 1090 1100
pF1KSD KDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFRNGLEDGYGEYRIPNKAMNKEDHYVGHW
. :.:.: .:. ::.: : . ::..: : : .: : :. . .. : . :..
CCDS72 SFFRYEGEWKAGRKHGHGKLLFKDGSYYEGAFVDGEITGEGRRHWAWSG----DTFSGQF
40 50 60 70 80 90
1110 1120 1130 1140 1150
pF1KSD KEGKMCGQGVYSYASGEVFEGCFQDNMRHGHGLL--RSGKLTSSS--------PSMFI--
:. : ::. : .: .:: . .::.:::.: :.:.. ..: :....
CCDS72 VLGEPQGYGVMEYKAGGCYEGEVSHGMREGHGFLVDRDGQVYQGSFHDNKRHGPGQMLFQ
100 110 120 130 140 150
1160 1170 1180 1190 1200
pF1KSD ------GQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNGVV-----VTQFGLYYEGN
:.:: :.. :.::. . : : :.:..:: .: : . :: .::. .:.
CCDS72 NGDKYDGDWVRDRRQGHGVLR-CADGSTYKGQWHSDVFSGLGSMAHCSGVTYYGLWINGH
160 170 180 190 200
1210 1220 1230 1240 1250 1260
pF1KSD FHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIEGYFSGEWGSGIKITG
CCDS72 PAEQATRIVILGPEVMEVAQGSPFSVNVQLLQDHGEIAKSESGRVLQISAGVRYVQLSAY
210 220 230 240 250 260
>>CCDS40.1 MORN1 gene_id:79906|Hs108|chr1 (497 aa)
initn: 105 init1: 105 opt: 287 Z-score: 315.8 bits: 69.7 E(32554): 2.9e-11
Smith-Waterman score: 289; 31.4% identity (56.7% similar) in 210 aa overlap (1018-1201:7-209)
990 1000 1010 1020 1030 1040
pF1KSD STPQEKTKWLRAISQAVDQALRGMSDLPPYGSGSSV-QRQEPPISRSAK--YTFYKDPRL
:. :: :..:: : . : : :
CCDS40 MAAAGEGTPSSRGPRRDPP-RRPPRNGYGVYVYPN-
10 20 30
1050 1060 1070 1080 1090 1100
pF1KSD KDATYDGRWLSGKPHGRGVLKWPDGKMYSGMFRNGLEDGYGEYRIPNKAMNKEDHYVGHW
. :.:.: .:. ::.: : . ::..: : : .: : :. . .. : . :..
CCDS40 SFFRYEGEWKAGRKHGHGKLLFKDGSYYEGAFVDGEITGEGRRHWAWSG----DTFSGQF
40 50 60 70 80 90
1110 1120 1130 1140 1150
pF1KSD KEGKMCGQGVYSYASGEVFEGCFQDNMRHGHGLL--RSGKLTSSS--------PSMFI--
:. : ::. : .: .:: . .::.:::.: :.:.. ..: :....
CCDS40 VLGEPQGYGVMEYKAGGCYEGEVSHGMREGHGFLVDRDGQVYQGSFHDNKRHGPGQMLFQ
100 110 120 130 140 150
1160 1170 1180 1190 1200
pF1KSD ------GQWVMDKKAGYGVFDDITRGEKYMGMWQDDVCQGNGVV-----VTQFGLYYEGN
:.:: :.. :.::. . : : :.:..:: .: : . :: .::. .:.
CCDS40 NGDKYDGDWVRDRRQGHGVLR-CADGSTYKGQWHSDVFSGLGSMAHCSGVTYYGLWINGH
160 170 180 190 200
1210 1220 1230 1240 1250 1260
pF1KSD FHLNKMMGNGVLLSEDDTIYEGEFSDDWTLSGKGTLTMPNGDYIEGYFSGEWGSGIKITG
CCDS40 PAEQATRIVILGPEVMEVAQGSPFSVNVQLLQDHGEIAKSESGRVLQISAGVRYVQLSAY
210 220 230 240 250 260
>>CCDS10021.1 HERC2 gene_id:8924|Hs108|chr15 (4834 aa)
initn: 469 init1: 243 opt: 301 Z-score: 315.8 bits: 72.9 E(32554): 2.9e-11
Smith-Waterman score: 301; 32.1% identity (59.3% similar) in 209 aa overlap (477-683:4012-4212)
450 460 470 480 490 500
pF1KSD KDSREEQVKQESMQGKKSSSLVDIREEETEGGSRRLSLPGLLSQVSPRLLRKAARVKTRT
:.. ::.. : : .: ::.. .: .
CCDS10 LATLRPVQLIGGEQTLFAVTADGKLYATGYGAGGRLGIGGTESVSTPTLLESIQHVFIKK
3990 4000 4010 4020 4030 4040
510 520 530 540 550 560
pF1KSD VVLTPTYSGEADALLPSLRTEVWTWGKGKEGQLGHGDVLPRLQPLCVKCLDGKEVIHLEA
:... :: : : . ::..::....:.::::. : .: .. : : ::. . :
CCDS10 VAVN---SGGKHCLALSSEGEVYSWGEAEDGKLGHGNRSPCDRPRVIESLRGIEVVDVAA
4050 4060 4070 4080 4090
570 580 590 600 610 620
pF1KSD GGYHSLALTAKSQVYSWGSNTFGQLGHSDFPTTV-PRLAKISSENGVWSIAAGRDYSLFL
:: :: .:: ...:.::.. .:.::::: . :.:.. . . : .:: : . :
CCDS10 GGAHSACVTAAGDLYTWGKGRYGRLGHSDSEDQLKPKLVEALQGHRVVDIACGSGDAQTL
4100 4110 4120 4130 4140 4150
630 640 650 660 670 680
pF1KSD VDTEDFQPGLYYSGRQDPTEGDNLPENHSGSKTPVLL-SCSKLGYISRVTAGKDSYLALV
:.: .. : : : . .: :.:. . : . :: . .: :.. .::
CCDS10 CLTDD--DTVWSWG--DGDYGKLGRGGSDGCKVPMKIDSLTGLGVV-KVECGSQFSVALT
4160 4170 4180 4190 4200 4210
690 700 710 720 730 740
pF1KSD DKNIMGYIASLHELATTERRFYSKLSDIKSQILRPLLSLENLGTTTTVQLLQEVASRFSK
CCDS10 KSGAVYTWGKGDYHRLGHGSDDHVRRPRQVQGLQGKKVIAIATGSLHCVCCTEDGEVYTW
4220 4230 4240 4250 4260 4270
1657 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:40:16 2016 done: Thu Nov 3 06:40:17 2016
Total Scan time: 5.200 Total Display time: 0.330
Function used was FASTA [36.3.4 Apr, 2011]