FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2430, 533 aa
1>>>pF1KE2430 533 - 533 aa - 533 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5349+/-0.000704; mu= 18.3882+/- 0.043
mean_var=86.0476+/-17.018, 0's: 0 Z-trim(111.9): 27 B-trim: 0 in 0/52
Lambda= 0.138263
statistics sampled from 12733 (12760) to 12733 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.744), E-opt: 0.2 (0.392), width: 16
Scan time: 3.130
The best scores are: opt bits E(32554)
CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 3754 758.5 4.3e-219
CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 2797 567.5 1e-161
CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 1750 358.8 1e-98
CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 1729 354.6 1.8e-97
CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 539 117.2 4.7e-26
CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 516 112.6 1.1e-24
CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 354 80.3 6.7e-15
CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 349 79.3 1.3e-14
CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 349 79.4 1.4e-14
CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 334 76.3 9.7e-14
CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 331 75.8 1.6e-13
CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 305 70.6 5.6e-12
>>CCDS4043.1 ARSB gene_id:411|Hs108|chr5 (533 aa)
initn: 3754 init1: 3754 opt: 3754 Z-score: 4046.9 bits: 758.5 E(32554): 4.3e-219
Smith-Waterman score: 3754; 99.8% identity (100.0% similar) in 533 aa overlap (1-533:1-533)
10 20 30 40 50 60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS40 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 EYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 EYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDRD
430 440 450 460 470 480
490 500 510 520 530
pF1KE2 PEERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATGVWGPWM
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS40 PEERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATGVWGPWM
490 500 510 520 530
>>CCDS43334.1 ARSB gene_id:411|Hs108|chr5 (413 aa)
initn: 2796 init1: 2796 opt: 2797 Z-score: 3016.8 bits: 567.5 E(32554): 1e-161
Smith-Waterman score: 2797; 98.5% identity (99.3% similar) in 411 aa overlap (1-410:1-411)
10 20 30 40 50 60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GFHGSRIRTPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHER
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CTLIDALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::.::
CCDS43 NGGQTLAGGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKL
310 320 330 340 350 360
370 380 390 400 410
pF1KE2 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPC-PRNSMAPAKDDSSL
:::::::::::::::::::::::::::::::::::::::::::: :. :.
CCDS43 ARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPYWPECSLLL
370 380 390 400 410
420 430 440 450 460 470
pF1KE2 PEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTLWLFDIDR
>>CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 (599 aa)
initn: 1869 init1: 774 opt: 1750 Z-score: 1885.9 bits: 358.8 E(32554): 1e-98
Smith-Waterman score: 1858; 53.7% identity (77.2% similar) in 501 aa overlap (41-532:72-554)
20 30 40 50 60 70
pF1KE2 RGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSRIRTP
.. :::.:.:::: :. :::.:::.:.::
CCDS43 GYLSWGQALEEEEEGALLAQAGEKLEPSTTSTSQPHLIFILADDQGFRDVGYHGSEIKTP
50 60 70 80 90 100
80 90 100 110 120 130
pF1KE2 HLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPLDEKLLP
:: ::: :: :.:::.::.:::::::..::.:::.:::::.:: : ::.:.:::. ::
CCDS43 TLDKLAAEGVKLENYYVQPICTPSRSQFITGKYQIHTGLQHSIIRPTQPNCLPLDNATLP
110 120 130 140 150 160
140 150 160 170 180 190
pF1KE2 QLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHERCTLIDALNVT
: :::.::.::::::::::.:::::.::::::::.:: :::: :::.: .: :. ..
CCDS43 QKLKEVGYSTHMVGKWHLGFYRKECMPTRRGFDTFFGSLLGSGDYYTHYKC---DSPGM-
170 180 190 200 210
200 210 220 230 240
pF1KE2 RCALDFRDGEEVATGYKN-MYSTNIFTKRAIALITNHPPEKPLFLYLALQSVHEPLQVPE
:. :. .....: : : .:::...:.:. ....: : ::.:::.: :.:: :::.:
CCDS43 -CGYDLYENDNAAWDYDNGIYSTQMYTQRVQQILASHNPTKPIFLYIAYQAVHSPLQAPG
220 230 240 250 260 270
250 260 270 280 290 300
pF1KE2 EYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTDNGGQTLAGG
.:.. : : . ::..::.:.: .:::..::: :::. :..::...:.:.::::: :::
CCDS43 RYFEHYRSIININRRRYAAMLSCLDEAINNVTLALKTYGFYNNSIIIYSSDNGGQPTAGG
280 290 300 310 320 330
310 320 330 340 350 360
pF1KE2 NNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGTK
.:::::: : . ::::.:.:::: :::::.::. .::.::.:: :::..::.:. .
CCDS43 SNWPLRGSKGTYWEGGIRAVGFVHSPLLKNKGTVCKELVHITDWYPTLISLAEGQIDEDI
340 350 360 370 380 390
370 380 390 400 410 420
pF1KE2 PLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTSV
:::.:.:.::::: :::...:::::: .. ::. : :. .::..
CCDS43 QLDGYDIWETISEGLRSPRVDILHNIDPIYTK-----------AKNGSWAAGYGIWNTAI
400 410 420 430 440
430 440 450 460 470 480
pF1KE2 HAAIRHGNWKLLTGYPGCGYWFPP-------PSQYNVSEIPSSDPPTKTLWLFDIDRDPE
..::: .:::::: :: . : :: :.... .: : :..:::.: ::
CCDS43 QSAIRVQHWKLLTGNPGYSDWVPPQSFSNLGPNRWHNERITLSTG--KSVWLFNITADPY
450 460 470 480 490 500
490 500 510 520 530
pF1KE2 ERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATG-VWGPWM
:: ::: .:: :: ::: ::. ..: .::: .: .::: .:. .: :::::
CCDS43 ERVDLSNRYPGIVKKLLRRLSQFNKTAVPVRYPPKDPRSNPRLNGGVWGPWYKEETKKKK
510 520 530 540 550 560
CCDS43 PSKNQAEKKQKKSKKKKKKQQKAVSGSTCHSGVTCG
570 580 590
>>CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 (569 aa)
initn: 1890 init1: 832 opt: 1729 Z-score: 1863.5 bits: 354.6 E(32554): 1.8e-97
Smith-Waterman score: 1855; 54.6% identity (76.7% similar) in 502 aa overlap (39-532:41-523)
10 20 30 40 50 60
pF1KE2 LPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSRIR
:. .:::..:.:.:: :..:::.::: :.
CCDS34 SLLSFGYLSWDWAKPSFVADGPGEAGEQPSAAPPQPPHIIFILTDDQGYHDVGYHGSDIE
20 30 40 50 60 70
70 80 90 100 110 120
pF1KE2 TPHLDALAAGGVLLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPLDEKL
:: :: ::: :: :.::: ::.:::::::::::::::.:::::.:: : ::.:.:::.
CCDS34 TPTLDRLAAKGVKLENYYIQPICTPSRSQLLTGRYQIHTGLQHSIIRPQQPNCLPLDQVT
80 90 100 110 120 130
130 140 150 160 170 180
pF1KE2 LPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGYLLGSEDYYSHERCTLIDALN
::: :.::::.::::::::::.::::::::::::::..: : :. :::... : :. .
CCDS34 LPQKLQEAGYSTHMVGKWHLGFYRKECLPTRRGFDTFLGSLTGNVDYYTYDNC---DGPG
140 150 160 170 180
190 200 210 220 230 240
pF1KE2 VTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPLFLYLALQSVHEPLQVP
: :..:...::.:: : ...::: ....:: ....: :..:::::.:.:.:: ::: :
CCDS34 V--CGFDLHEGENVAWGLSGQYSTMLYAQRASHILASHSPQRPLFLYVAFQAVHTPLQSP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 EEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTDNGGQTLAG
.::: : . . :..::.::. ::::: :.: ::: :..::.:.:::.::::::..:
CCDS34 REYLYRYRTMGNVARRKYAAMVTCMDEAVRNITWALKRYGFYNNSVIIFSSDNGGQTFSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 GNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGT
:.:::::::: . :::::::.::: :::::.: .: :.::.:: :::. :: : :...
CCDS34 GSNWPLRGRKGTYWEGGVRGLGFVHSPLLKRKQRTSRALMHITDWYPTLVGLAGGTTSAA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 KPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTS
:::.::: .:::: ::: :.:::::: . :. : .. .::.
CCDS34 DGLDGYDVWPAISEGRASPRTEILHNIDPLY-----------NHAQHGSLEGGFGIWNTA
370 380 390 400 410
430 440 450 460 470 480
pF1KE2 VHAAIRHGNWKLLTGYPGCGYWFPP------P-SQYNVSEIPSSDPPTKTLWLFDIDRDP
:.:::: :.:::::: :: : :.:: : : .:. .. : ...:::.:. ::
CCDS34 VQAAIRVGEWKLLTGDPGYGDWIPPQTLATFPGSWWNLERMASV---RQAVWLFNISADP
420 430 440 450 460 470
490 500 510 520 530
pF1KE2 EERHDLSREYPHIVTKLLSRLQFYHKHSVPVYFPAQDPRCDPKATG-VWGPWM
::.::. . : .: ::.:: :.. ..:: .::..:: : .: .::::
CCDS34 YEREDLAGQRPDVVRTLLARLAEYNRTAIPVRYPAENPRAHPDFNGGAWGPWASDEEEEE
480 490 500 510 520 530
CCDS34 EEGRARSFSRGRRKKKCKICKLRSFFRKLNTRLMSQRI
540 550 560
>>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa)
initn: 554 init1: 139 opt: 539 Z-score: 581.2 bits: 117.2 E(32554): 4.7e-26
Smith-Waterman score: 677; 31.2% identity (57.0% similar) in 528 aa overlap (28-531:13-498)
10 20 30 40 50
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND
:::.:. : :: :: .::....:: ::.::.:
CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD
10 20 30 40
60 70 80 90 100 110
pF1KE2 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H--
.: .: : ::.:: .:: :.:. :.:. .:::.:::. ::::: ::.:. :
CCDS10 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR
50 60 70 80 90 100
120 130 140 150 160
pF1KE2 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY--
. : . . .: .:.:::.:::.:::....::::::: .: . : ..::: .::
CCDS10 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN
110 120 130 140 150 160
170 180 190 200 210 220
pF1KE2 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH
.: : .. . : : : .: .. :: :. :.:. ..:. .: .
CCDS10 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE2 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS
..:.::: :....: :. . :: :. ..: .:. : .:...:.. :..
CCDS10 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD
230 240 250 260 270
290 300 310 320 330 340
pF1KE2 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV
. .:: .:..:::. .. ::.: :. : . .:::.: ... : :
CCDS10 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE2 KNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS
...: : : . : . :: . . .::... :. .: : : :
CCDS10 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDR--------PIFYYR
340 350 360 370 380
410 420 430 440 450 460
pF1KE2 SPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWK-LLTGYPGCGYWFPPPSQYNVSE
. ... : .: ...: : ..:. . : : :.: :::
CCDS10 G----DTLMAA----TLGQHKA-----HFWTWTNSWENFRQGIDFC------PGQ-NVSG
390 400 410 420
470 480 490 500 510
pF1KE2 IPSSD--PPTKTLWLFDIDRDPEERHDLS---REYPHIVTKLLSRLQFYHKHSVPVYFPA
. . . :: .: . ::: :: :: :: . .... : .: ... ::. :
CCDS10 VTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQ-P-
430 440 450 460 470 480
520 530
pF1KE2 QDPRCDPKATGVWGPWM
: :. :. :.:
CCDS10 QLNVCN-WAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH
490 500 510 520
>>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa)
initn: 532 init1: 197 opt: 516 Z-score: 556.6 bits: 112.6 E(32554): 1.1e-24
Smith-Waterman score: 568; 29.5% identity (52.8% similar) in 528 aa overlap (25-523:6-485)
10 20 30 40 50 60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
: ::: :: .: ...:::..:...:::::..:.
CCDS14 MSMGAPRSLLLALA---AGLAVARPPNIVLIFADDLGYGDL
10 20 30
70 80 90 100 110
pF1KE2 GFHGS-RIRTPHLDALAAGGVLLDNYYTQ-PLCTPSRSQLLTGRYQIRTGLQHQIIWPCQ
: .: ::.:: :::::. . ..:. ::::::. ::::: .: :. .. : .
CCDS14 GCYGHPSSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLVPSS
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE2 PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRK-ECLPTRRGFDTYFGYLLGSEDYYS
. .::.: . ..: :: : :.::::::. . :: ..:: ..: ::
CCDS14 RGGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGI------PYS
100 110 120 130 140 150
180 190 200 210 220
pF1KE2 HER--CTLIDALN-VTRCALDFRDGEEVATGYKNMYSTNI------FTKRAIALITN---
:.. : . . .: : .: :. . : .:. .
CCDS14 HDQGPCQNLTCFPPATPCDGGCDQGLVPIPLLANLSVEAQPPWLPGLEARYMAFAHDLMA
160 170 180 190 200 210
230 240 250 260 270 280
pF1KE2 --HPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAA
. ..:.::: : . .: : .. .: . ..: .. . .: :::.. .:
CCDS14 DAQRQDRPFFLYYASHHTHYP------QFSGQSFAERSGRGPFGDSLMELDAAVGTLMTA
220 230 240 250 260
290 300 310 320 330 340
pF1KE2 LKSSGLWNNTVFIFSTDNGGQTLA---GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQK
. . :: ..:. ::..::: .:. :: . :: : . .::::: ... :
CCDS14 IGDLGLLEETLVIFTADNGPETMRMSRGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAP
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE2 GVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFV
:: . :: : :::: :: : . ::::: ..: ..
CCDS14 GVTH-ELASSLDLLPTLAALA-GAPLPNVTLDGFD-------------------LSPLLL
330 340 350 360
410 420 430 440 450
pF1KE2 DSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGY--WFPPPSQYN
.. ::.:. : : .: : .: :..: : .. :. .
CCDS14 GTGKSPRQSLF------FYPSYPDEVRGVFA-VRTGKYKAHFFTQGSAHSDTTADPACHA
370 380 390 400 410
460 470 480 490 500 510
pF1KE2 VSEIPSSDPPTKTLWLFDIDRDPEERHDL----SREYPHIVTKLLSRLQFYHKH-SVPVY
: . . .:: :.:...:: : ..: . :... . :..::. . . .. :
CCDS14 SSSLTAHEPPL----LYDLSKDPGENYNLLGGVAGATPEVL-QALKQLQLLKAQLDAAVT
420 430 440 450 460 470
520 530
pF1KE2 F-PAQDPRC-DPKATGVWGPWM
: :.: : ::
CCDS14 FGPSQVARGEDPALQICCHPGCTPRPACCHCPDPHA
480 490 500
>>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa)
initn: 520 init1: 125 opt: 354 Z-score: 381.0 bits: 80.3 E(32554): 6.7e-15
Smith-Waterman score: 506; 27.2% identity (48.1% similar) in 580 aa overlap (15-514:3-550)
10 20 30 40 50 60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
::: :.:. :. :: . . :..:....:::: .:.
CCDS14 MRPRR---PLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDL
10 20 30 40
70 80 90 100 110
pF1KE2 GFHGS-RIRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQIRTGL----QHQII
: .:. .::::.: :: :: : .. . ::.:::: .::::: ::.:. ....:
CCDS14 GCYGNDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVI
50 60 70 80 90 100
120 130 140 150 160
pF1KE2 WPCQ-PSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGM----YRKECL-PTRRGFDTYFG-
:. .::.: : :::. ::.: ..:::: :. .: : ::: :.:
CCDS14 QNLAVPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGM
110 120 130 140 150 160
170 180 190
pF1KE2 -YLLGSEDYYSHER------------CTLIDALNVTR-----------------------
. : . . . : :. . :. .
CCDS14 PFTLVDSCWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILF
170 180 190 200 210 220
200 210 220 230
pF1KE2 -------------------CALDFRDGEEVATGYKNMYSTNIFTKRAIALITNHPPEKPL
: : .: : . .: . .:..:.::... : : .
CCDS14 IFLLGYAWFSSHTSPLYWDCLL-MRGHEITEQPMKAERAGSIMVKEAISFLERHSKET-F
230 240 250 260 270 280
240 250 260 270 280 290
pF1KE2 FLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKSSGLWNN
.:.... :: :: . . :: ... :. : :: ::.. :. . :: ::
CCDS14 LLFFSFLHVHTPLPTTD------DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNN
290 300 310 320 330
300 310 320 330 340
pF1KE2 TVFIFSTDNGGQTLA-------GGNNWPLRGRK-WSLWEGGVRGVGFVASPLLKQKGVKN
:. :..:.::. : :: : .: : . ::::.: :.: : :
CCDS14 TLVYFTSDHGGHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLI
340 350 360 370 380 390
350 360 370 380 390 400
pF1KE2 RELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSP
.: . : :::. ... : . .:: :. .. . . :.: . ... .
CCDS14 KEPTSLMDILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAV-
400 410 420 430 440 450
410 420 430 440 450 460
pF1KE2 CPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPS
: ::::. . . : : :. .:. : : :.
CCDS14 ----RWIP-KDDSGSVWKAHYVTPVFQPPASGG-CYVTSLCRC---FGEQVTYH------
460 470 480 490 500
470 480 490 500 510 520
pF1KE2 SDPPTKTLWLFDIDRDPEERHDLS--REYPH--IVTKLLSRLQFYHKHSVPVYFPAQDPR
.:: :::..::: : :. : : .. :. . :. ... ::: .
CCDS14 -NPPL----LFDLSRDPSESTPLTPATEPLHDFVIKKVANALKEHQETIVPVTYQLSELN
510 520 530 540 550
530
pF1KE2 CDPKATGVWGPWM
CCDS14 QGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
560 570 580 590
>>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa)
initn: 561 init1: 110 opt: 349 Z-score: 375.7 bits: 79.3 E(32554): 1.3e-14
Smith-Waterman score: 515; 28.3% identity (51.0% similar) in 573 aa overlap (17-517:12-558)
10 20 30 40 50 60
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDV
: ::..: .:: ::: .:. .. :....:.::::: .:.
CCDS14 MLHLHHSCLCFRSWLPAMLAVLLS--LAPSASSDISASRPNILLLMADDLGIGDI
10 20 30 40 50
70 80 90 100 110
pF1KE2 GFHGSR-IRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQIRTGLQHQI-----
: .:. .:::..: :: :: : .. . ::::::. .::::: .:.:. .:
CCDS14 GCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVL
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 IWPCQPSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY----RKECL-PTRRGFDTYFGY
: . .: .: . ..::: ::.: ..::::::. .: : ..::: ..:.
CCDS14 QWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGM
120 130 140 150 160 170
170 180 190 200
pF1KE2 ---LLGSEDYY--SHERCTLIDALN-----VTRCALDFRDGEEV-------------ATG
:.:. . :..: .: . :: .. :: . :. . : .
CCDS14 PFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALS
180 190 200 210 220 230
210 220 230 240
pF1KE2 YKNMYSTNIFTKRAIA-----LITNHP-PEKPLFLY----LALQSV--------HEPLQV
. ... :. :. :. :: :.:. . : :: : : :. .
CCDS14 AVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLL
240 250 260 270 280 290
250 260 270 280 290 300
pF1KE2 PEEYLK---PYDFIQD---KNRHH-YAGMVSLMDEAVGNVTAALKSSGLWNNTVFIFSTD
.:. : ... :. : :. : :: :: . .: :: :.:.. :..:
CCDS14 FVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSD
300 310 320 330 340 350
310 320 330 340 350
pF1KE2 NGGQ-------TLAGGNNWPLRGRK-WSLWEGGVRGVGFVASPLLKQKGVKNRELIHISD
.::. : :: : .: : . ::::.: :. : . : : . :
CCDS14 HGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMD
360 370 380 390 400 410
360 370 380 390 400 410
pF1KE2 WLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDSSPCPRNSMAP
.::...:: :.. . .:: :. . . :.: . :. .. : .
CCDS14 VFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAA---RWHQ--
420 430 440 450 460
420 430 440 450 460 470
pF1KE2 AKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYNVSEIPSSDPPTKTL
.: ... . : : : : : : : .. .. :::
CCDS14 -RDRGTMWKVH-FVTPVFQPEGAGA---CYGRKVC----PCFGE----KVVHHDPPL---
470 480 490 500 510
480 490 500 510 520
pF1KE2 WLFDIDRDPEERHDLSREYPHIVTKLLSRLQ---FYHKHSV-PVYFPAQDPRCDPKATGV
:::..::: : : :. . ... :.: . :.... :: : :
CCDS14 -LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPV--PLQLDRLGNIWRPW
520 530 540 550 560
530
pF1KE2 WGPWM
CCDS14 LQPCCGPFPLCWCLREDDPQ
570 580
>>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa)
initn: 561 init1: 110 opt: 349 Z-score: 375.4 bits: 79.4 E(32554): 1.4e-14
Smith-Waterman score: 515; 28.3% identity (51.0% similar) in 573 aa overlap (17-517:37-583)
10 20 30 40
pF1KE2 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPH
: ::..: .:: ::: .:. .. :.
CCDS75 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLS--LAPSASSDISASRPN
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 LVFLLADDLGWNDVGFHGSR-IRTPHLDALAAGGVLLDNYYTQP-LCTPSRSQLLTGRYQ
...:.::::: .:.: .:. .:::..: :: :: : .. . ::::::. .:::::
CCDS75 ILLLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYP
70 80 90 100 110 120
110 120 130 140 150
pF1KE2 IRTGLQHQI-----IWPCQPSCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMY----RKEC
.:.:. .: : . .: .: . ..::: ::.: ..::::::. .:
CCDS75 VRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHC
130 140 150 160 170 180
160 170 180 190 200
pF1KE2 L-PTRRGFDTYFGY---LLGSEDYY--SHERCTLIDALN-----VTRCALDFRDGEEV--
: ..::: ..:. :.:. . :..: .: . :: .. :: . :. .
CCDS75 HHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHL
190 200 210 220 230 240
210 220 230 240
pF1KE2 -----------ATGYKNMYSTNIFTKRAIA-----LITNHP-PEKPLFLY----LALQSV
: . . ... :. :. :. :: :.:. . : :: :
CCDS75 IPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEV
250 260 270 280 290 300
250 260 270 280
pF1KE2 --------HEPLQVPEEYLK---PYDFIQD---KNRHH-YAGMVSLMDEAVGNVTAALKS
: :. . .:. : ... :. : :. : :: :: . .:
CCDS75 ASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDV
310 320 330 340 350 360
290 300 310 320 330
pF1KE2 SGLWNNTVFIFSTDNGGQ-------TLAGGNNWPLRGRK-WSLWEGGVRGVGFVASPLLK
:: :.:.. :..:.::. : :: : .: : . ::::.: :. : .
CCDS75 EGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVL
370 380 390 400 410 420
340 350 360 370 380 390
pF1KE2 QKGVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPN
: : . : .::...:: :.. . .:: :. . . :.: .
CCDS75 PAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCER
430 440 450 460 470 480
400 410 420 430 440 450
pF1KE2 FVDSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFPPPSQYN
:. .. : . .: ... . : : : : : : : ..
CCDS75 FLHAA---RWHQ---RDRGTMWKVH-FVTPVFQPEGAGA---CYGRKVC----PCFGE--
490 500 510 520
460 470 480 490 500 510
pF1KE2 VSEIPSSDPPTKTLWLFDIDRDPEERHDLSREYPHIVTKLLSRLQ---FYHKHSV-PVYF
.. ::: :::..::: : : :. . ... :.: . :.... ::
CCDS75 --KVVHHDPPL----LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPV--
530 540 550 560 570 580
520 530
pF1KE2 PAQDPRCDPKATGVWGPWM
: :
CCDS75 PLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
590 600 610
>>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa)
initn: 372 init1: 120 opt: 334 Z-score: 360.2 bits: 76.3 E(32554): 9.7e-14
Smith-Waterman score: 481; 29.8% identity (57.3% similar) in 396 aa overlap (37-398:28-410)
10 20 30 40 50 60
pF1KE2 ASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGAGASRPPHLVFLLADDLGWNDVGFHGSR
:: .. :..:..::::.::.:.: . ..
CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAE
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 IR-TPHLDALAAGGV-LLDNYYTQPLCTPSRSQLLTGRYQIRTGLQHQIIWPCQPSCVPL
. : .:: .:. :. ..: . . :.:::..::::: .:.:. ... . .::
CCDS11 TKDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFAVTSVGG-LPL
60 70 80 90 100 110
130 140 150 160 170
pF1KE2 DEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFG----YLLGSEDY--YSH
.: : ..:..:::.: ..:::::: .. :. :::: ::: . .: : :.:
CCDS11 NETTLAEVLQQAGYVTGIIGKWHLG-HHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNH
120 130 140 150 160 170
180 190 200 210 220
pF1KE2 ERCTLID-----ALNVTR-C----ALDFRDGEEVATGYKNMYS-TNIFTKRAIALITNHP
: . :. : : :: . .. ... :. : .. ....: .:
CCDS11 PPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSSLAQKYAEKATQFIQRAS
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 PE-KPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS
.:..::.:: .: :: : . : ..: :.. . :: ::.. .
CCDS11 TSGRPFLLYVALAHMHVPLPVTQLPAAP------RGRSLYGAGLWEMDSLVGQIKDKVDH
240 250 260 270 280
290 300 310 320 330
pF1KE2 SGLWNNTVFIFSTDNGGQT----LAGGNN-----WPLR--GR--KWSLWEGGVRGVGFVA
. . .:: . :. ::: . :::. . : : : : . :::: : ...
CCDS11 T-VKENTFLWFTGDNGPWAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAY
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE2 SPLLKQKGVKNRELIHISDWLPTLMKLARGHTNGTKPLDGFDVWKTI-SEGSPSPRIELL
: .: . :. . : .::.. ::.. . .:: :: ... ....:. :. :.
CCDS11 WPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQPGHRV-LF
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE2 HNIDPNFVDSSPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWKLLTGYPGCGYWFP
: ::
CCDS11 H---PNSGAAGEFGALQTVRLERYKAFYITGGARACDGSTGPELQHKFPLIFNLEDDTAE
410 420 430 440 450 460
533 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 19:58:17 2016 done: Mon Nov 7 19:58:18 2016
Total Scan time: 3.130 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]