FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5681, 522 aa
1>>>pF1KE5681 522 - 522 aa - 522 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6970+/-0.000782; mu= 15.9494+/- 0.047
mean_var=69.1717+/-14.143, 0's: 0 Z-trim(108.5): 28 B-trim: 241 in 1/48
Lambda= 0.154209
statistics sampled from 10211 (10236) to 10211 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.314), width: 16
Scan time: 2.770
The best scores are: opt bits E(32554)
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 3665 824.5 0
CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 958 222.2 1.1e-57
CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 570 135.9 9.1e-32
CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 552 131.9 1.8e-30
CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 537 128.5 1.5e-29
CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 537 128.6 1.8e-29
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 487 117.4 4e-26
CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 427 104.1 4.6e-22
CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 427 104.1 4.8e-22
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 423 103.2 8.7e-22
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 414 101.2 3.3e-21
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 414 101.2 3.3e-21
CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 402 98.5 2.2e-20
CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 400 98.1 2.9e-20
CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 400 98.1 3e-20
>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa)
initn: 3665 init1: 3665 opt: 3665 Z-score: 4403.6 bits: 824.5 E(32554): 0
Smith-Waterman score: 3665; 100.0% identity (100.0% similar) in 522 aa overlap (1-522:1-522)
10 20 30 40 50 60
pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 EQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCHFGPYDNKARPNIPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCHFGPYDNKARPNIPV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 YRDWEMVGRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPVY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 YRDWEMVGRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPVY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 ASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAALISAPEQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAALISAPEQG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 GSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 RAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 GQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALV
430 440 450 460 470 480
490 500 510 520
pF1KE5 PAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
::::::::::::::::::::::::::::::::::::::::::
CCDS10 PAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
490 500 510 520
>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa)
initn: 709 init1: 323 opt: 958 Z-score: 1149.0 bits: 222.2 E(32554): 1.1e-57
Smith-Waterman score: 968; 37.3% identity (60.5% similar) in 534 aa overlap (13-512:9-506)
10 20 30 40 50 60
pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
:::.: :::.... .::::.:.. ::.:.:::: ::.:: :::::
CCDS14 MSMGAPRSLLLAL-AAGLAVA---RPPNIVLIFADDLGYGDLGCYGHPSSTTPNLD
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
..:: :: : .:: ::.::::::::::::.: :.: .. .:. ::.:
CCDS14 QLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYP------GVLVPSS-RGGLPLE
60 70 80 90 100
130 140 150 160 170
pF1KE5 EQLLPELLKKAGYVSKIVGKWHLGHRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--R
: . :.: ::.. ..:::::: :. : : ..:: ...: : : :: .: .
CCDS14 EVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFP
110 120 130 140 150 160
180 190 200 210 220
pF1KE5 PNIPVYRDWEMVGRYYEEFPINLKTGEAN------LTQIYLQEALDFI---KRQARHHPF
: : .. : . ::.. ::. : :. : :.. .:: : ::
CCDS14 PATPCDGGCDQ-GLVPIPLLANLSV-EAQPPWLPGLEARYMAFAHDLMADAQRQDR--PF
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE5 FLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFT
:::.: :: : .... : : :: .::.. :.: ..: .. . :: . ..:.:.::
CCDS14 FLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFT
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE5 SDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLF
.::: . .:: .: . ::: ::.:::.::::::.::::.. : :.:.:.: .::.
CCDS14 ADNGPETMRMS-RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPG-VTHELASSLDLL
290 300 310 320 330
350 360 370 380 390
pF1KE5 TTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYY-------RGDTLMAATLGQH
: :::: .: . ..::..: : :: :. . .:.: :: ..:. :..
CCDS14 PTLAALAG-APLPNVTLDGFDLSPLLLGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKY
340 350 360 370 380 390
400 410 420 430 440 450
pF1KE5 KAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL----
::::.: .. . : . :..:.: . ::.. :..:::: . :
CCDS14 KAHFFTQGSAHSDTTAD-PAC--HASSSLTAH------EPPLLYDLSKDPGENYNLLGGV
400 410 420 430 440
460 470 480 490 500
pF1KE5 SFASAEYQEALSRITSVVQQHQEALV--PAQ------PQLNVCNWAVMNWAPPGCEKLGK
. :. : .::... . : . :.. :.: : :..: :::
CCDS14 AGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQIC-------CHPGCTPRPA
450 460 470 480 490 500
510 520
pF1KE5 CLTPPESIPKKCLWSH
: :.
CCDS14 CCHCPDPHA
>>CCDS46736.1 ARSA gene_id:410|Hs108|chr22 (423 aa)
initn: 400 init1: 201 opt: 570 Z-score: 683.8 bits: 135.9 E(32554): 9.1e-32
Smith-Waterman score: 661; 33.5% identity (57.4% similar) in 430 aa overlap (115-512:14-420)
90 100 110 120 130 140
pF1KE5 ALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG
::.: : . :.: ::.. ..::::::
CCDS46 MGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLTGMAGKWHLG
10 20 30 40
150 160 170 180 190
pF1KE5 HRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--RPNIPVYRDWEMVGRYYEEFPINLK
:. : : ..:: ...: : : :: .: . : : .. : . ::.
CCDS46 VGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ-GLVPIPLLANLS
50 60 70 80 90 100
200 210 220 230 240 250
pF1KE5 TGEAN------LTQIYLQEALDFIKRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRG
. ::. : :. : :.. :. .:::::.: :: : .... : : ::
CCDS46 V-EAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSFAERSGRG
110 120 130 140 150 160
260 270 280 290 300 310
pF1KE5 RYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQT
.::.. :.: ..: .. . :: . ..:.:.::.::: . .:: .: . ::: :
CCDS46 PFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMS-RGGCSGLLRCGKGT
170 180 190 200 210 220
320 330 340 350 360 370
pF1KE5 TFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTL
:.:::.::::::.::::.. : :.:.:.: .::. : :::: .: . ..::..: : :
CCDS46 TYEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAG-APLPNVTLDGFDLSPLL
230 240 250 260 270
380 390 400 410 420
pF1KE5 L-QGRLMDRPIFYY-------RGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNV
: :. . .:.: :: ..:. :..::::.: .. . : .
CCDS46 LGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKYKAHFFTQGSAHSDTTAD-PAC--HAS
280 290 300 310 320 330
430 440 450 460 470 480
pF1KE5 SGVTTHNLEDHTKLPLIFHLGRDPGERFPL----SFASAEYQEALSRITSVVQQHQEALV
:..:.: . ::.. :..:::: . : . :. : .::... . : . :..
CCDS46 SSLTAH------EPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVT
340 350 360 370 380
490 500 510 520
pF1KE5 --PAQ------PQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
:.: : :..: ::: : :.
CCDS46 FGPSQVARGEDPALQIC-------CHPGCTPRPACCHCPDPHA
390 400 410 420
>>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa)
initn: 755 init1: 196 opt: 552 Z-score: 660.4 bits: 131.9 E(32554): 1.8e-30
Smith-Waterman score: 752; 30.3% identity (55.8% similar) in 532 aa overlap (56-516:18-544)
30 40 50 60 70 80
pF1KE5 GAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAA
:::.::.: .:. . . :: ::.:::::
CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA
10 20 30 40
90 100 110 120 130 140
pF1KE5 LLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLGH
.:::: :.:.:. .. .. .: ::.: .: . ..::. ::.. ..::::::
CCDS75 FLTGRYPVRSGMVSSIGYRVLQWTGAS--GGLPTNETTFAKILKEKGYATGLIGKWHLGL
50 60 70 80 90 100
150 160 170 180
pF1KE5 RPQ------FHPLKHGFDEWFGSP-----NCHFGPYDNKARPNIP-----VYRDWEMV--
. :::.::::...: : .: ..: : :. ... .:
CCDS75 NCESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEK-RVNLEQKLNFLFQVLALVAL
110 120 130 140 150 160
190 200
pF1KE5 ----GRYYEEFPI-----------------------------------NLKTGEANL---
:. . .:. : : .
CCDS75 TLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQ
170 180 190 200 210 220
210 220 230 240 250 260
pF1KE5 --TQIYLQEALDFIKRQARHHPFFLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDD
: . :::. .:.::. .: ::.:. . .: :. . . ::: : .: ::: :.:.:
CCDS75 RTTPLILQEVASFLKRN-KHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDW
230 240 250 260 270 280
270 280 290 300 310
pF1KE5 SIGKILELLQDLHVADNTFVFFTSDNGAAL---ISAPEQGGSNGPFLCGK-QTTFEGGMR
.:.::. :. ....:...::::.:..: .. . :: :: . :: . .:::.:
CCDS75 MVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIR
290 300 310 320 330 340
320 330 340 350 360 370
pF1KE5 EPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLM
:.. ::: . ::.: . :.::.: : . ::: :.::.::: .::: :: ..
CCDS75 VPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHS
350 360 370 380 390 400
380 390 400 410 420 430
pF1KE5 DRPIFYYRGDTLMAATLGQHKAHFWTWTNSWEN--FR-QGIDFCPGQNVSGVTTHNLEDH
:. .... . .. :. ... . : . . :. .: : :..: ... :
CCDS75 DHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHH
410 420 430 440 450 460
440 450 460 470 480 490
pF1KE5 TKLPLIFHLGRDPGERFPLSFASAE-YQEALSRITSVVQQHQEALVPAQPQLNVCNWAVM
::.: :.:::.: :. :: . ... :. ..: .::..: :. ::. .
CCDS75 DP-PLLFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWR
470 480 490 500 510 520
500 510 520
pF1KE5 NWAPPGCEKLGKCLTPPESIPKKCLWSH
: : : . : :. :.
CCDS75 PWLQPCCGPFPLCWCLREDDPQ
530 540
>>CCDS43334.1 ARSB gene_id:411|Hs108|chr5 (413 aa)
initn: 509 init1: 139 opt: 537 Z-score: 644.3 bits: 128.5 E(32554): 1.5e-29
Smith-Waterman score: 638; 34.2% identity (62.3% similar) in 374 aa overlap (13-375:28-383)
10 20 30 40
pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD
:::.:. : :: :: .::....:: ::.::.:
CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND
10 20 30 40 50
50 60 70 80 90 100
pF1KE5 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR
.: .: : ::.:: .:: :.:. :.:. .:::.:::. ::::: ::.:. :
CCDS43 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H--
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE5 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN
. : . . .: .:.:::.:::.:::....::::::: .: . : ..::: .::
CCDS43 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY--
120 130 140 150 160
170 180 190 200 210 220
pF1KE5 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ
.: : .. . : : : .: .. :: :. :.:. ..:. .: .
CCDS43 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH
170 180 190 200 210 220
230 240 250 260 270
pF1KE5 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD
..:.::: :....: :. . :: :. ..: .:. : .:...:.. :..
CCDS43 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE5 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ
. .:: .:..:::. .. ::.: :. : . .:::.: ... : :
CCDS43 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE5 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMAAT
...: : : . : . :: . . .::... :. .:
CCDS43 KNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE5 LGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL
CCDS43 SPYWPECSLLL
410
>>CCDS4043.1 ARSB gene_id:411|Hs108|chr5 (533 aa)
initn: 552 init1: 139 opt: 537 Z-score: 642.5 bits: 128.6 E(32554): 1.8e-29
Smith-Waterman score: 675; 31.2% identity (57.0% similar) in 528 aa overlap (13-498:28-531)
10 20 30 40
pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD
:::.:. : :: :: .::....:: ::.::.:
CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND
10 20 30 40 50
50 60 70 80 90 100
pF1KE5 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR
.: .: : ::.:: .:: :.:. :.:. .:::.:::. ::::: ::.:. :
CCDS40 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H--
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE5 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN
. : . . .: .:.:::.:::.:::....::::::: .: . : ..::: .::
CCDS40 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY--
120 130 140 150 160
170 180 190 200 210 220
pF1KE5 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ
.: : .. . : : : .: .. :: :. :.:. ..:. .: .
CCDS40 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH
170 180 190 200 210 220
230 240 250 260 270
pF1KE5 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD
..:.::: :....: :. . :: :. ..: .:. : .:...:.. :..
CCDS40 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE5 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ
. .:: .:..:::. .. ::.: :. : . .:::.: ... : :
CCDS40 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV
290 300 310 320 330 340
340 350 360 370 380
pF1KE5 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDR--------PIFYYR
...: : : . : . :: . . .::... :. .: : : :
CCDS40 KNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS
350 360 370 380 390 400
390 400 410 420
pF1KE5 G----DTLMAA----TLGQHKA-----HFWTWTNSWENFRQGIDFC------PGQ-NVSG
. ... : .: ...: : ..:. . : : :.: :::
CCDS40 SPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWK-LLTGYPGCGYWFPPPSQYNVSE
410 420 430 440 450 460
430 440 450 460 470 480
pF1KE5 VTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQ-P-
. . . :: .: . ::: :: :: :: . .... : .: ... ::. :
CCDS40 IPSSD--PPTKTLWLFDIDRDPEERHDLS---REYPHIVTKLLSRLQFYHKHSVPVYFPA
470 480 490 500 510
490 500 510 520
pF1KE5 QLNVCN-WAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
: :. :. :.:
CCDS40 QDPRCDPKATGVWGPWM
520 530
>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa)
initn: 892 init1: 284 opt: 487 Z-score: 582.5 bits: 117.4 E(32554): 4e-26
Smith-Waterman score: 862; 37.4% identity (61.5% similar) in 478 aa overlap (29-472:34-486)
10 20 30 40 50
pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPN
: ::....: :::::::::. ...: :
CCDS11 LFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKDTAN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE5 LDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIP
::.::.::. : .:..: ::::::.:::::: .::: .:: . . :::.:
CCDS11 LDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGV------TRNFAVTS--VGGLP
70 80 90 100 110
120 130 140 150 160 170
pF1KE5 DSEQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCH-FG----P-YDN
.: : :.:..::::. :.:::::::. ..:: .::: .:: : : .: : :..
CCDS11 LNETTLAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNH
120 130 140 150 160 170
180 190 200 210
pF1KE5 KARPNIP--------VYRD--WEMVGRYYE-----EFPINLKTGEANLTQIYLQEALDFI
: : . :: ... :: : :.::.. :.: : ..: .::
CCDS11 PPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSS----LAQKYAEKATQFI
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE5 KRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRGR--YGDAVREIDDSIGKILELLQD
.: . .::.:: :. :.:. ... : .. ::: :: .. :.:. .:.: . . :
CCDS11 QRASTSGRPFLLYVALAHMHVPLPVTQ--LPAAPRGRSLYGAGLWEMDSLVGQIKDKV-D
240 250 260 270 280
280 290 300 310 320
pF1KE5 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLC----------GKQTTFEGGMREPALA
: .:::..::.::: . : .:: ::: .::::.::: : ::::
CCDS11 HTVKENTFLWFTGDNGP-WAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALA
290 300 310 320 330 340
330 340 350 360 370 380
pF1KE5 WWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIFY
.:::.: .. .: : :..:.: : .::: . :. : .::... .:. :: .
CCDS11 YWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLF-GRSQPGHRVL
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE5 YRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHL
.. .. :. .: . : : .. .. .: : .:. : :.::::.:
CCDS11 FHPNSGAAGEFGALQ------TVRLERYKAFYITGGARACDGSTGPELQ-H-KFPLIFNL
410 420 430 440 450
450 460 470 480 490 500
pF1KE5 GRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKL
: .: :: ..:::: .: .. .:.
CCDS11 EDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQI
460 470 480 490 500 510
>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa)
initn: 857 init1: 272 opt: 427 Z-score: 509.6 bits: 104.1 E(32554): 4.6e-22
Smith-Waterman score: 836; 31.8% identity (57.9% similar) in 554 aa overlap (9-487:12-560)
10 20 30 40 50
pF1KE5 MAAVVAATRWW---QLLLVLSAAGMGASG-APQPPNILLLLMDDMGWGDLGVYGEPS
: : .: ..:: : ..: . . ::::::. ::.: ::.: ::. .
CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE5 RETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEI
.:::.::.: .:. . . :: ::.:::::.:::: :.:.:. .. .. .:
CCDS14 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS-
70 80 90 100 110
120 130 140 150 160
pF1KE5 VGGIPDSEQLLPELLKKAGYVSKIVGKWHLGHRPQ------FHPLKHGFDEWFGSP----
::.: .: . ..::. ::.. ..:::::: . :::.::::...: :
CCDS14 -GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLM
120 130 140 150 160 170
170 180 190
pF1KE5 -NCHFGPYDNKARPNIP-----VYRDWEMV------GRYYEEFPI---------------
.: ..: : :. ... .: :. . .:.
CCDS14 GDCARWELSEK-RVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLL
180 190 200 210 220 230
200 210 220 230
pF1KE5 --------------------NLKTGEANL-----TQIYLQEALDFIKRQARHHPFFLYWA
: : . : . :::. .:.::. .: ::.:. .
CCDS14 LASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRN-KHGPFLLFVS
240 250 260 270 280 290
240 250 260 270 280 290
pF1KE5 VDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGA
.: :. . . ::: : .: ::: :.:.: .:.::. :. ....:...::::.:.
CCDS14 FLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG
300 310 320 330 340 350
300 310 320 330 340
pF1KE5 AL---ISAPEQGGSNGPFLCGK-QTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFT
.: .. . :: :: . :: . .:::.: :.. ::: . ::.: . :.::.:
CCDS14 SLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFP
360 370 380 390 400 410
350 360 370 380 390 400
pF1KE5 TSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYYRGDTLMAATLGQHKAHFWTWT
: . ::: :.::.::: .::: :: .. :. .... . .. :. ... . :
CCDS14 TVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWK
420 430 440 450 460 470
410 420 430 440 450 460
pF1KE5 NSWEN--FR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAE-YQ
. . :. .: : :..: ... : ::.: :.:::.: :. :: .
CCDS14 VHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDP-PLLFDLSRDPSETHILTPASEPVFY
480 490 500 510 520 530
470 480 490 500 510 520
pF1KE5 EALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
... :. ..: .::..: :. ::.
CCDS14 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa)
initn: 857 init1: 272 opt: 427 Z-score: 509.3 bits: 104.1 E(32554): 4.8e-22
Smith-Waterman score: 836; 31.8% identity (57.9% similar) in 554 aa overlap (9-487:37-585)
10 20 30
pF1KE5 MAAVVAATRWW---QLLLVLSAAGMGASG-APQPPNIL
: : .: ..:: : ..: . . ::::
CCDS75 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNIL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE5 LLLMDDMGWGDLGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIR
::. ::.: ::.: ::. . .:::.::.: .:. . . :: ::.:::::.:::: :.:
CCDS75 LLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVR
70 80 90 100 110 120
100 110 120 130 140
pF1KE5 NGFYTTNAHARNAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLGHRPQ------
.:. .. .. .: ::.: .: . ..::. ::.. ..:::::: .
CCDS75 SGMVSSIGYRVLQWTGAS--GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHC
130 140 150 160 170 180
150 160 170 180 190
pF1KE5 FHPLKHGFDEWFGSP-----NCHFGPYDNKARPNIP-----VYRDWEMV------GRYYE
:::.::::...: : .: ..: : :. ... .: :. .
CCDS75 HHPLHHGFDHFYGMPFSLMGDCARWELSEK-RVNLEQKLNFLFQVLALVALTLVAGKLTH
190 200 210 220 230 240
200 210
pF1KE5 EFPI-----------------------------------NLKTGEANL-----TQIYLQE
.:. : : . : . :::
CCDS75 LIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQE
250 260 270 280 290 300
220 230 240 250 260 270
pF1KE5 ALDFIKRQARHHPFFLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELL
. .:.::. .: ::.:. . .: :. . . ::: : .: ::: :.:.: .:.::. :
CCDS75 VASFLKRN-KHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTL
310 320 330 340 350 360
280 290 300 310 320
pF1KE5 QDLHVADNTFVFFTSDNGAAL---ISAPEQGGSNGPFLCGK-QTTFEGGMREPALAWWPG
. ....:...::::.:..: .. . :: :: . :: . .:::.: :.. :::
CCDS75 DVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPG
370 380 390 400 410 420
330 340 350 360 370 380
pF1KE5 HVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYYRG
. ::.: . :.::.: : . ::: :.::.::: .::: :: .. :. ....
CCDS75 VLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYC
430 440 450 460 470 480
390 400 410 420 430 440
pF1KE5 DTLMAATLGQHKAHFWTWTNSWEN--FR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHL
. .. :. ... . : . . :. .: : :..: ... : ::.: :
CCDS75 ERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDP-PLLFDL
490 500 510 520 530 540
450 460 470 480 490 500
pF1KE5 GRDPGERFPLSFASAE-YQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEK
.:::.: :. :: . ... :. ..: .::..: :. ::.
CCDS75 SRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGP
550 560 570 580 590 600
510 520
pF1KE5 LGKCLTPPESIPKKCLWSH
CCDS75 FPLCWCLREDDPQ
610
>>CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 (599 aa)
initn: 350 init1: 121 opt: 423 Z-score: 504.6 bits: 103.2 E(32554): 8.7e-22
Smith-Waterman score: 558; 26.9% identity (55.5% similar) in 517 aa overlap (31-517:76-572)
10 20 30 40 50 60
pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD
:.....: ::.:. :.: .: . ::.::
CCDS43 WGQALEEEEEGALLAQAGEKLEPSTTSTSQPHLIFILADDQGFRDVGYHGSEIK-TPTLD
50 60 70 80 90 100
70 80 90 100 110 120
pF1KE5 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS
..::::. . :.: ..:.:.:::. ..::. :..:. : . : . . .: .
CCDS43 KLAAEGVKLENYY-VQPICTPSRSQFITGKYQIHTGL----QH--SIIRPTQP-NCLPLD
110 120 130 140 150
130 140 150 160 170
pF1KE5 EQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPNCHFGPYDNKARPNIP
. ::. ::..:: ...::::::: .: . : ..::: .::: : : .. . . :
CCDS43 NATLPQKLKEVGYSTHMVGKWHLGFYRKECMPTRRGFDTFFGSL-LGSGDYYTHYKCDSP
160 170 180 190 200 210
180 190 200 210 220 230
pF1KE5 VYRDWEMVGRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPV
. ... .. . .: . ::.: :.. ... . .:.::: : .:.:.:.
CCDS43 GMCGYDL--YENDNAAWDYDNGIYS-TQMYTQRVQQILASHNPTKPIFLYIAYQAVHSPL
220 230 240 250 260 270
240 250 260 270 280 290
pF1KE5 YASKPFLGTSQ------RGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAAL
: .. . : ::. . .:..:... :. .:......::::.
CCDS43 QAPGRYFEHYRSIININRRRYAAMLSCLDEAINNVTLALKTYGFYNNSIIIYSSDNGG--
280 290 300 310 320 330
300 310 320 330 340 350
pF1KE5 ISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALA
: :::: :. .: : .:::.: ... : . : : ..: : : . : ..::
CCDS43 --QPTAGGSNWPLRGSKGTYWEGGIRAVGFVHSPLLKNKGTVCKELVHITDWYPTLISLA
340 350 360 370 380
360 370 380 390 400
pF1KE5 GLTPPSDRAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMA-ATLGQHKAHFWTWTNS----
: .:: .. :. .: : . . : ... : :. : . :...
CCDS43 EGQIDEDIQLDGYDIWETISEGLRSPRVDILHNIDPIYTKAKNGSWAAGYGIWNTAIQSA
390 400 410 420 430 440
410 420 430 440 450
pF1KE5 -----WENFR--QGI-DFCPGQNVSGVTT---HNLE---DHTKLPLIFHLGRDPGERFPL
:. . : :. : :. :.. :: . . : .:.. :: :: :
CCDS43 IRVQHWKLLTGNPGYSDWVPPQSFSNLGPNRWHNERITLSTGKSVWLFNITADPYERVDL
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE5 SFASAEYQEALSRITSVVQQHQEALVPAQ-PQLNVCNWAVMN---WAPPGCEKLGKCLTP
: .: .... ..: ... ::.. : . . .: :.: :. :
CCDS43 S---NRYPGIVKKLLRRLSQFNKTAVPVRYPPKDPRSNPRLNGGVWGPWYKEETKKKKPS
510 520 530 540 550 560
520
pF1KE5 PESIPKKCLWSH
.. ::
CCDS43 KNQAEKKQKKSKKKKKKQQKAVSGSTCHSGVTCG
570 580 590
522 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 05:48:53 2016 done: Tue Nov 8 05:48:54 2016
Total Scan time: 2.770 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]