FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0376, 562 aa
1>>>pF1KE0376 562 - 562 aa - 562 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6161+/-0.000866; mu= 17.2403+/- 0.052
mean_var=70.8936+/-14.787, 0's: 0 Z-trim(106.6): 28 B-trim: 9 in 1/48
Lambda= 0.152325
statistics sampled from 9038 (9063) to 9038 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.278), width: 16
Scan time: 3.050
The best scores are: opt bits E(32554)
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 3976 883.1 0
CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 2651 591.9 7e-169
CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 2429 543.1 3.4e-154
CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 2429 543.2 3.5e-154
CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 2410 539.0 6.1e-153
CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 2283 511.0 1.4e-144
CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 2063 462.7 5.5e-130
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 414 100.3 6.1e-21
CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 401 97.4 4.3e-20
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 376 92.0 2e-18
CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 342 84.4 2.9e-16
CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 305 76.3 8.1e-14
CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 305 76.4 1e-13
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 261 66.7 8.7e-11
>>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa)
initn: 3976 init1: 3976 opt: 3976 Z-score: 4719.4 bits: 883.1 E(32554): 0
Smith-Waterman score: 3976; 100.0% identity (100.0% similar) in 562 aa overlap (1-562:1-562)
10 20 30 40 50 60
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 VASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 EFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ
490 500 510 520 530 540
550 560
pF1KE0 PCCGTFPFCGCDKEDDILPMAP
::::::::::::::::::::::
CCDS35 PCCGTFPFCGCDKEDDILPMAP
550 560
>>CCDS35196.1 ARSD gene_id:414|Hs108|chrX (593 aa)
initn: 2293 init1: 1859 opt: 2651 Z-score: 3145.4 bits: 591.9 E(32554): 7e-169
Smith-Waterman score: 2651; 64.8% identity (84.5% similar) in 560 aa overlap (2-559:35-593)
10 20 30
pF1KE0 MTRNA-RPNIVLLMADDLGVGDLCCYGNNSV
: :: .:::.:.::::::.::: :::::..
CCDS35 ARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYGNNTL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 STPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSG
:::::.:: :::::::::::: .::::::::::::. .:::: .: : ::. : .:::
CCDS35 RTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGM-DASNGYRALQWNAGSG
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 GLPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSD
::: ::::::..::..:: :::::::: :..::::.:::.::::::: ::::.:: : .:
CCDS35 GLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTLTND
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE0 CQASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTS
:. .. ::. :: .:: : ::: . : . .::: ... .: .. ::: :
CCDS35 CDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLFFIS
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE0 WYSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHV
::::.::.:::::::::::.. .::: ::.::::::::...:::.:. :::::.:.:::
CCDS35 WYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSLLHV
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE0 HTPLISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEP
: ::.. . :.:.:..: ::::::::::..::.:.:.... : : :..:::::.:::::
CCDS35 HIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGHLEA
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE0 LDGAVQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSY
:: ::::::::::::::::::::::::::::.::.:: :::::.:::::::..::.
CCDS35 RDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPTVVQ
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE0 IGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYV
. :: . :::::::..:.:::.: ..: ::::::::: .::..:::::: ..:::.::.
CCDS35 LVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKVHYT
430 440 450 460 470 480
460 470 480 490 500
pF1KE0 TPKFYPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKK
::.:.:::.::::: :.: :::. ::.: ::::::.::::::: ::.::.:::. .:: .
CCDS35 TPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAVIAR
490 500 510 520 530 540
510 520 530 540 550 560
pF1KE0 MEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::. :::.::.:::::::. : .:::::::::: ::::.: .. : :
CCDS35 VGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
550 560 570 580 590
>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2881.8 bits: 543.1 E(32554): 3.4e-154
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:36-587)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
CCDS14 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
CCDS14 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
CCDS14 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
CCDS14 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
CCDS14 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
CCDS14 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
CCDS14 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
CCDS14 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
430 440 450 460 470 480
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
CCDS14 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
490 500 510 520 530 540
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
CCDS14 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
550 560 570 580
>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa)
initn: 2066 init1: 1642 opt: 2429 Z-score: 2881.5 bits: 543.2 E(32554): 3.5e-154
Smith-Waterman score: 2429; 60.8% identity (82.8% similar) in 553 aa overlap (5-556:61-612)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN
.::::.::::::::.::. :::::.. :::
CCDS75 QISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMRTPN
40 50 60 70 80 90
40 50 60 70 80 90
pF1KE0 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT
::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.::::::
CCDS75 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT
100 110 120 130 140
100 110 120 130 140 150
pF1KE0 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS
:::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..::
CCDS75 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE0 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS
. : . :. :: . .:::: . :. :... . : : .. :: : :...: :
CCDS75 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE0 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL
.. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: ::
CCDS75 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
:. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: :
CCDS75 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
.: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..::
CCDS75 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG
390 400 410 420 430 440
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF
. ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: :
CCDS75 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE0 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA
:::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... :
CCDS75 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA
510 520 530 540 550 560
520 530 540 550 560
pF1KE0 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
. ::.:::.::: :.. ...::.:::::::: ::.: : .:::
CCDS75 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
570 580 590 600 610
>>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa)
initn: 2139 init1: 1519 opt: 2410 Z-score: 2859.2 bits: 539.0 E(32554): 6.1e-153
Smith-Waterman score: 2410; 60.2% identity (82.0% similar) in 560 aa overlap (6-562:29-586)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR
.:::::.:.::::.::: ::::... ::.:::
CCDS14 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET
:: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: :::
CCDS14 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP
:.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . .
CCDS14 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF
. . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::.
CCDS14 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK
:.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: .
CCDS14 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE0 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL
:.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .::
CCDS14 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE0 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS
::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: :
CCDS14 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP
:::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : :
CCDS14 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR
..:.:: ...: : :. ::::.::::::.::::::. ::.: .::: : ::::. :..
CCDS14 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALK
480 490 500 510 520 530
520 530 540 550 560
pF1KE0 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP
::..:..:: :.: .: . ::.::::.:::: ::::... : .:
CCDS14 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
540 550 560 570 580 590
>>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa)
initn: 1674 init1: 1642 opt: 2283 Z-score: 2708.9 bits: 511.0 E(32554): 1.4e-144
Smith-Waterman score: 2283; 60.3% identity (82.3% similar) in 526 aa overlap (32-556:18-542)
10 20 30 40 50 60
pF1KE0 TRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVRLTQHLAAASMCTPSRAA
:::::::: .::.::::..:::.:::::::
CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA
10 20 30 40
70 80 90 100 110 120
pF1KE0 FLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQHRGYRTGLIGKWHLGLS
:::::::.::::::. . :.. : :.:::::::::::::.:...:: :::::::::::.
CCDS75 FLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLN
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE0 CASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTPELHRWLRIKLWISTVALALVPFLL
: : .:::.:::.::: .:::.::.:..:: . : . :. :: . .:::: . :
CCDS75 CESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTL
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE0 LIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNCILMRNHEIIQQPMKEEKV
. :... . : : .. :: : :...: : .. . .:.::::: : .::: ...
CCDS75 VAGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRT
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE0 ASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGRSKYGRYGDNVEEMDWMVG
. :.:.:. .:..: :. ::::: :::::: :::. ..:.:.: .: :::::::::::::
CCDS75 TPLILQEVASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVG
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE0 KILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGIYKGGKGMGGWEGGIRVPG
.:::.:: : :.: ::.:::::.:: :: : .: ::::::::::::::::::::::::
CCDS75 RILDTLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPG
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE0 IFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHE
:::::.:: :::::.:::::::..::. ..:: . ::::::::.:.::: : :.:::::
CCDS75 IFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHE
350 360 370 380 390 400
430 440 450 460 470 480
pF1KE0 FLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGD-VTYHDPP
::.::: .::..::::.: .:.::.:.::: : :::.::::: .: : :. :..::::
CCDS75 FLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPP
410 420 430 440 450 460
490 500 510 520 530 540
pF1KE0 LLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIREHRRTLTPVPQQFSVFNTIWKPWLQ
::::.::::::. :.: .::.: .:..... :. ::.:::.::: :.. ...::.::::
CCDS75 LLFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQ
470 480 490 500 510 520
550 560
pF1KE0 PCCGTFPFCGCDKEDDILPMAP
:::: ::.: : .:::
CCDS75 PCCGPFPLCWCLREDDPQ
530 540
>>CCDS14127.1 STS gene_id:412|Hs108|chrX (583 aa)
initn: 1745 init1: 1339 opt: 2063 Z-score: 2447.2 bits: 462.7 E(32554): 5.5e-130
Smith-Waterman score: 2063; 53.5% identity (78.3% similar) in 557 aa overlap (5-554:25-575)
10 20 30 40
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLAS
.::::.:.::::::.:: ::::... :::::::::
CCDS14 MPLRKMKIPFLLLFFLWEAESHAASRPNIILVMADDLGIGDPGCYGNKTIRTPNIDRLAS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 EGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFA
::.:::::::. .::::::::.:::::.::::.: .. . .: . ..::::::.: :::
CCDS14 GGVKLTQHLAASPLCTPSRAAFMTGRYPVRSGMAS-WSRTGVFLFTASSGGLPTDEITFA
70 80 90 100 110
110 120 130 140 150
pF1KE0 KLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASK----T
:::. .:: :.::::::::.:: :..: :.:::.:::.::::. . : ::. .. :
CCDS14 KLLKDQGYSTALIGKWHLGMSCHSKTDFCHHPLHHGFNYFYGISLTNLRDCKPGEGSVFT
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE0 PELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYG
..: . . : : :.: . : . . :: :.: . .:: :..: . .
CCDS14 TGFKRLVFLPLQIVGVTLLTLAALNCLG----LLHVPLGVFFSLLFLAALILTLFLGFLH
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE0 FTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLIS
. : ::..:::.:::::::. ..... . :: ::.: . :::: .:.::::: :.:
CCDS14 YFRPLNCFMMRNYEIIQQPMSYDNLTQRLTVEAAQFIQRNTETPFLLVLSYLHVHTALFS
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE0 KKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQ
.: :.:.:..: ::: :::::: ::.::. ::. :::: ::.:::::.:.:.: ... .
CCDS14 SKDFAGKSQHGVYGDAVEEMDWSVGQILNLLDELRLANDTLIYFTSDQGAHVEEVSSKGE
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE0 L-GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGI
. :: ::::::::. ..::::::::::.::: :..::. :.:::: :::.::.. ..:.
CCDS14 IHGGSNGIYKGGKA-NNWEGGIRVPGILRWPRVIQAGQKIDEPTSNMDIFPTVAKLAGAP
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE0 LSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFY
: .::.:::..:::::::....::::::::::..::..:::: .. ...::: . ::.:
CCDS14 LPEDRIIDGRDLMPLLEGKSQRSDHEFLFHYCNAYLNAVRWHPQNSTSIWKAFFFTPNFN
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE0 PEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAI
: :...:... .: : :. ::.::::::::::.:: : ::.: .:: : ..: :. :
CCDS14 PVGSNGCFATHVCFCFGSYVTHHDPPLLFDISKDPRERNPLTPASEPRFYEILKVMQEAA
480 490 500 510 520 530
520 530 540 550 560
pF1KE0 REHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPF-CGCDKEDDILPMAP
.: .:: ::.::: : .:::::: :: . . : ::.:
CCDS14 DRHTQTLPEVPDQFSWNNFLWKPWLQLCCPSTGLSCQCDREKQDKRLSR
540 550 560 570 580
>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa)
initn: 828 init1: 260 opt: 414 Z-score: 489.5 bits: 100.3 E(32554): 6.1e-21
Smith-Waterman score: 862; 32.7% identity (57.8% similar) in 548 aa overlap (7-549:31-507)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNID
:::.::. ::.: ::: ::. : :::.:
CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 RLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNR-AFTWLGGSGGLPTN
:.:.::. . . .: .:.:::::.:::: :::.:. .. : :.: ::.: .
CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE0 ETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASK
: . .::.. :: . ..:::::: : . .:::.::: ..: : .:. .
CCDS10 EQLLPELLKKAGYVSKIVGKWHLG----HRPQ--FHPLKHGFDEWFGSP-----NCHFGP
130 140 150 160
160 170 180 190 200 210
pF1KE0 TPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSY
. : : :: . : : .: .
CCDS10 YDNKAR----------------PN---IPVYRDWEMVG----------------RYYEEF
170 180 190
220 230 240 250 260 270
pF1KE0 GFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKRE-PFLLFFSFLHVHTPL
:. : ......:.::: ::.: :. ::.:... .:.:.
CCDS10 P---------------INLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPV
200 210 220 230
280 290 300 310 320 330
pF1KE0 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA
..: :.: :. ::::: :.:.: .::::. :.. ..:..:.:.::::::. : .:
CCDS10 YASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGA---ALISA
240 250 260 270 280 290
340 350 360 370 380 390
pF1KE0 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG
. :: :: . :: . .:::.: :.. ::. . ::.: .. :.::.. : ..:
CCDS10 PEQGGSNGPFLCGK-QTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGL
300 310 320 330 340 350
400 410 420 430 440 450
pF1KE0 ILSQDRVIDGQNLMP-LLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPK
.::.::: ::.: ::.:: :. .:.: : : .. :. : : .
CCDS10 TPPSDRAIDGLNLLPTLLQGRL--MDRP-IFYYRGDTLMAATLGQHK-AHFWTWTNSWEN
360 370 380 390 400 410
460 470 480 490 500 510
pF1KE0 FYPEGTGACYGSGICSCSG-DVTYHDP-PLLFDISRDPSEALPLNPDNEPLFDSVIKKME
: .: : :... . . .. : ::.: ..:::.: .::. . .. .....
CCDS10 FR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAE-YQEALSRIT
420 430 440 450 460
520 530 540 550 560
pF1KE0 AAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
.....:...:.:. :..: : : : : . :
CCDS10 SVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
470 480 490 500 510 520
>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa)
initn: 791 init1: 295 opt: 401 Z-score: 474.2 bits: 97.4 E(32554): 4.3e-20
Smith-Waterman score: 797; 32.8% identity (55.7% similar) in 551 aa overlap (7-551:23-501)
10 20 30 40
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDRLASEGVR
:::::..::::: ::: :::. : .:::.:.::. :.:
CCDS14 MSMGAPRSLLLALAAGLAVARPPNIVLIFADDLGYGDLGCYGHPSSTTPNLDQLAAGGLR
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 LTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNETTFAKLLQ
.:. . .:.:::::::.:::: :.: :: . . . :::: .:.: :..:
CCDS14 FTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS------RGGLPLEEVTVAEVLA
70 80 90 100 110
110 120 130 140 150 160
pF1KE0 HRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGL-LSDCQASKTPELHRWL
::: ::. ::::::.. . . : ..::: : :.:.. . :: .: .
CCDS14 ARGYLTGMAGKWHLGVG----PEGAFLPPHQGFHRFLGIPYSHDQGPCQ-----NLTCFP
120 130 140 150 160
170 180 190 200 210 220
pF1KE0 RIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGFTRRWNC
. .::: :: .: .:: . : :. :.
CCDS14 PATPCDGGCDQGLVP----IPLLAN-LSVEAQ-------------PPWLP--GLEARY--
170 180 190 200
230 240 250 260 270 280
pF1KE0 ILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISKKKFVGR
. :... . ..... ::.:... :.: : .: ..:. :
CCDS14 -MAFAHDLMADAQRQDR-------------------PFFLYYASHHTHYPQFSGQSFAER
210 220 230 240
290 300 310 320 330 340
pF1KE0 SKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQLGGWNGI
: : .::.. :.: :: .. :. . : ..::: ::.::: : .. :: .:.
CCDS14 SGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNG----PETMRMSRGGCSGL
250 260 270 280 290
350 360 370 380 390 400
pF1KE0 YKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILSQDRVID
. ::: .:::.: :.. ::. . : : .: .: .:. :::. ..:. : . ..:
CCDS14 LRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAGAPLP-NVTLD
300 310 320 330 340 350
410 420 430 440 450 460
pF1KE0 GQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKFYPEGTGACY
: .: ::: : ...: .. :: : . : :: . .:::. : : :
CCDS14 GFDLSPLLLG-TGKSPRQSLFFYPS-YPDEVRGVFAVRTGKYKAHFFTQGSAHSDTTA--
360 370 380 390 400 410
470 480 490 500 510 520
pF1KE0 GSGICSCSGDVTYHDPPLLFDISRDPSEALPL---NPDNEPLFDSVIKKMEAAIREHRRT
. : :...: :.::::.:.:.::.: : : ...:... . .
CCDS14 -DPACHASSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAA
420 430 440 450 460 470
530 540 550 560
pF1KE0 LTPVPQQFSVFNTIWKPWLQPCC--GTFPFCGCDKEDDILPMAP
.: :.: . . : :: :: : : .:
CCDS14 VTFGPSQVARGED---PALQICCHPGCTPRPACCHCPDPHA
480 490 500
>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa)
initn: 798 init1: 244 opt: 376 Z-score: 444.3 bits: 92.0 E(32554): 2e-18
Smith-Waterman score: 773; 31.1% identity (58.1% similar) in 570 aa overlap (2-551:31-522)
10 20 30
pF1KE0 MTRNARPNIVLLMADDLGVGDLCCYGNNSVS
::. .::.:...:::.: ::: .. .
CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE0 TPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGG
: :.:..::::.:... :::: :.::::..:::: .:.:.. : :. . . ::
CCDS11 TANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVT------RNFA-VTSVGG
70 80 90 100 110
100 110 120 130 140 150
pF1KE0 LPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDC
:: ::::.:..::. :: ::.::::::: . ::: .:: :..:.:.. :
CCDS11 LPLNETTLAEVLQQAGYVTGIIGKWHLG------HHGSYHPNFRGFDYYFGIPYSHDMGC
120 130 140 150 160
160 170 180 190 200 210
pF1KE0 QASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSW
. :: .. : :. . : . . .
CCDS11 --TDTPGYNH----------------PPCPACPQG----DGPSRNL----------QRDC
170 180 190
220 230 240 250 260
pF1KE0 YSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKR--EPFLLFFSFLH
:.. .. :..: .:..::.. ..:. . ..: ::.: . .::::. .. :
CCDS11 YTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALAH
200 210 220 230 240
270 280 290 300 310 320
pF1KE0 VHTPL-ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHL
.:.:: ... . :.. . :: .. ::: .::.: : .:. . ..:...::.:::
CCDS11 MHVPLPVTQLPAAPRGR-SLYGAGLWEMDSLVGQIKDKVDHT-VKENTFLWFTGDNGPWA
250 260 270 280 290 300
330 340 350 360 370 380
pF1KE0 EPLDGAVQLGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMD
. . : ..: ..:... .: . :::: :::.. ::. . .. . . :..:
CCDS11 QKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVLD
310 320 330 340 350 360
390 400 410 420 430
pF1KE0 IYPTLSYIGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFH----YCGVY--LHTVRWH
:.::. .. . : : : .:: .. .: :: :. :. ::: : . :.::: .
CCDS11 IFPTVVALAQASLPQGRRFDGVDVSEVLFGR-SQPGHRVLFHPNSGAAGEFGALQTVRLE
370 380 390 400 410 420
440 450 460 470 480 490
pF1KE0 QKDCATVWKAHYVTPKFYPEGTGACYGSGICSCSGDVTYHDPPLLFDISRDPSEALPLNP
. .:: :.: :. :: :: .: : ::.:.. : .::.::.
CCDS11 R------YKAFYITG-----GARACDGS-----TGPELQHKFPLIFNLEDDTAEAVPLER
430 440 450 460 470
500 510 520 530 540 550
pF1KE0 DNEPLFDSVIKKMEAAIREHRRTLTPVPQQF-----SVFNTIWKPWLQPCCGTFPF-CGC
. ...:.. : :..:. : :.. : . : . :::. . . : :
CCDS11 GG--------AEYQAVLPEVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQIACRC
480 490 500 510 520
560
pF1KE0 DKEDDILPMAP
CCDS11 QAA
562 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 13:30:26 2016 done: Thu Nov 3 13:30:27 2016
Total Scan time: 3.050 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]