FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5681, 522 aa 1>>>pF1KE5681 522 - 522 aa - 522 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6970+/-0.000782; mu= 15.9494+/- 0.047 mean_var=69.1717+/-14.143, 0's: 0 Z-trim(108.5): 28 B-trim: 241 in 1/48 Lambda= 0.154209 statistics sampled from 10211 (10236) to 10211 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.688), E-opt: 0.2 (0.314), width: 16 Scan time: 2.770 The best scores are: opt bits E(32554) CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 3665 824.5 0 CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 958 222.2 1.1e-57 CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 570 135.9 9.1e-32 CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 552 131.9 1.8e-30 CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 537 128.5 1.5e-29 CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 537 128.6 1.8e-29 CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 487 117.4 4e-26 CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 427 104.1 4.6e-22 CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 427 104.1 4.8e-22 CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 ( 599) 423 103.2 8.7e-22 CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 414 101.2 3.3e-21 CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 414 101.2 3.3e-21 CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 402 98.5 2.2e-20 CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 400 98.1 2.9e-20 CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 400 98.1 3e-20 >>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa) initn: 3665 init1: 3665 opt: 3665 Z-score: 4403.6 bits: 824.5 E(32554): 0 Smith-Waterman score: 3665; 100.0% identity (100.0% similar) in 522 aa overlap (1-522:1-522) 10 20 30 40 50 60 pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 EQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCHFGPYDNKARPNIPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 EQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCHFGPYDNKARPNIPV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 YRDWEMVGRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 YRDWEMVGRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPVY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 ASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAALISAPEQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAALISAPEQG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 RAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 GQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALV 430 440 450 460 470 480 490 500 510 520 pF1KE5 PAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH :::::::::::::::::::::::::::::::::::::::::: CCDS10 PAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH 490 500 510 520 >>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa) initn: 709 init1: 323 opt: 958 Z-score: 1149.0 bits: 222.2 E(32554): 1.1e-57 Smith-Waterman score: 968; 37.3% identity (60.5% similar) in 534 aa overlap (13-512:9-506) 10 20 30 40 50 60 pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD :::.: :::.... .::::.:.. ::.:.:::: ::.:: ::::: CCDS14 MSMGAPRSLLLAL-AAGLAVA---RPPNIVLIFADDLGYGDLGCYGHPSSTTPNLD 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS ..:: :: : .:: ::.::::::::::::.: :.: .. .:. ::.: CCDS14 QLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYP------GVLVPSS-RGGLPLE 60 70 80 90 100 130 140 150 160 170 pF1KE5 EQLLPELLKKAGYVSKIVGKWHLGHRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--R : . :.: ::.. ..:::::: :. : : ..:: ...: : : :: .: . CCDS14 EVTVAEVLAARGYLTGMAGKWHLGVGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFP 110 120 130 140 150 160 180 190 200 210 220 pF1KE5 PNIPVYRDWEMVGRYYEEFPINLKTGEAN------LTQIYLQEALDFI---KRQARHHPF : : .. : . ::.. ::. : :. : :.. .:: : :: CCDS14 PATPCDGGCDQ-GLVPIPLLANLSV-EAQPPWLPGLEARYMAFAHDLMADAQRQDR--PF 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE5 FLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFT :::.: :: : .... : : :: .::.. :.: ..: .. . :: . ..:.:.:: CCDS14 FLYYASHHTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFT 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE5 SDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLF .::: . .:: .: . ::: ::.:::.::::::.::::.. : :.:.:.: .::. CCDS14 ADNGPETMRMS-RGGCSGLLRCGKGTTYEGGVREPALAFWPGHIAPG-VTHELASSLDLL 290 300 310 320 330 350 360 370 380 390 pF1KE5 TTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYY-------RGDTLMAATLGQH : :::: .: . ..::..: : :: :. . .:.: :: ..:. :.. CCDS14 PTLAALAG-APLPNVTLDGFDLSPLLLGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKY 340 350 360 370 380 390 400 410 420 430 440 450 pF1KE5 KAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL---- ::::.: .. . : . :..:.: . ::.. :..:::: . : CCDS14 KAHFFTQGSAHSDTTAD-PAC--HASSSLTAH------EPPLLYDLSKDPGENYNLLGGV 400 410 420 430 440 460 470 480 490 500 pF1KE5 SFASAEYQEALSRITSVVQQHQEALV--PAQ------PQLNVCNWAVMNWAPPGCEKLGK . :. : .::... . : . :.. :.: : :..: ::: CCDS14 AGATPEVLQALKQLQLLKAQLDAAVTFGPSQVARGEDPALQIC-------CHPGCTPRPA 450 460 470 480 490 500 510 520 pF1KE5 CLTPPESIPKKCLWSH : :. CCDS14 CCHCPDPHA >>CCDS46736.1 ARSA gene_id:410|Hs108|chr22 (423 aa) initn: 400 init1: 201 opt: 570 Z-score: 683.8 bits: 135.9 E(32554): 9.1e-32 Smith-Waterman score: 661; 33.5% identity (57.4% similar) in 430 aa overlap (115-512:14-420) 90 100 110 120 130 140 pF1KE5 ALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG ::.: : . :.: ::.. ..:::::: CCDS46 MGMYPGVLVPSSRGGLPLEEVTVAEVLAARGYLTGMAGKWHLG 10 20 30 40 150 160 170 180 190 pF1KE5 HRPQ--FHPLKHGFDEWFGSPNCH-FGPYDNKA--RPNIPVYRDWEMVGRYYEEFPINLK :. : : ..:: ...: : : :: .: . : : .. : . ::. CCDS46 VGPEGAFLPPHQGFHRFLGIPYSHDQGPCQNLTCFPPATPCDGGCDQ-GLVPIPLLANLS 50 60 70 80 90 100 200 210 220 230 240 250 pF1KE5 TGEAN------LTQIYLQEALDFIKRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRG . ::. : :. : :.. :. .:::::.: :: : .... : : :: CCDS46 V-EAQPPWLPGLEARYMAFAHDLMADAQRQDRPFFLYYASHHTHYPQFSGQSFAERSGRG 110 120 130 140 150 160 260 270 280 290 300 310 pF1KE5 RYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQT .::.. :.: ..: .. . :: . ..:.:.::.::: . .:: .: . ::: : CCDS46 PFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGPETMRMS-RGGCSGLLRCGKGT 170 180 190 200 210 220 320 330 340 350 360 370 pF1KE5 TFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTL :.:::.::::::.::::.. : :.:.:.: .::. : :::: .: . ..::..: : : CCDS46 TYEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTLAALAG-APLPNVTLDGFDLSPLL 230 240 250 260 270 380 390 400 410 420 pF1KE5 L-QGRLMDRPIFYY-------RGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNV : :. . .:.: :: ..:. :..::::.: .. . : . CCDS46 LGTGKSPRQSLFFYPSYPDEVRG--VFAVRTGKYKAHFFTQGSAHSDTTAD-PAC--HAS 280 290 300 310 320 330 430 440 450 460 470 480 pF1KE5 SGVTTHNLEDHTKLPLIFHLGRDPGERFPL----SFASAEYQEALSRITSVVQQHQEALV :..:.: . ::.. :..:::: . : . :. : .::... . : . :.. CCDS46 SSLTAH------EPPLLYDLSKDPGENYNLLGGVAGATPEVLQALKQLQLLKAQLDAAVT 340 350 360 370 380 490 500 510 520 pF1KE5 --PAQ------PQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH :.: : :..: ::: : :. CCDS46 FGPSQVARGEDPALQIC-------CHPGCTPRPACCHCPDPHA 390 400 410 420 >>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa) initn: 755 init1: 196 opt: 552 Z-score: 660.4 bits: 131.9 E(32554): 1.8e-30 Smith-Waterman score: 752; 30.3% identity (55.8% similar) in 532 aa overlap (56-516:18-544) 30 40 50 60 70 80 pF1KE5 GAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAA :::.::.: .:. . . :: ::.::::: CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA 10 20 30 40 90 100 110 120 130 140 pF1KE5 LLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLGH .:::: :.:.:. .. .. .: ::.: .: . ..::. ::.. ..:::::: CCDS75 FLTGRYPVRSGMVSSIGYRVLQWTGAS--GGLPTNETTFAKILKEKGYATGLIGKWHLGL 50 60 70 80 90 100 150 160 170 180 pF1KE5 RPQ------FHPLKHGFDEWFGSP-----NCHFGPYDNKARPNIP-----VYRDWEMV-- . :::.::::...: : .: ..: : :. ... .: CCDS75 NCESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEK-RVNLEQKLNFLFQVLALVAL 110 120 130 140 150 160 190 200 pF1KE5 ----GRYYEEFPI-----------------------------------NLKTGEANL--- :. . .:. : : . CCDS75 TLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQ 170 180 190 200 210 220 210 220 230 240 250 260 pF1KE5 --TQIYLQEALDFIKRQARHHPFFLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDD : . :::. .:.::. .: ::.:. . .: :. . . ::: : .: ::: :.:.: CCDS75 RTTPLILQEVASFLKRN-KHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDW 230 240 250 260 270 280 270 280 290 300 310 pF1KE5 SIGKILELLQDLHVADNTFVFFTSDNGAAL---ISAPEQGGSNGPFLCGK-QTTFEGGMR .:.::. :. ....:...::::.:..: .. . :: :: . :: . .:::.: CCDS75 MVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIR 290 300 310 320 330 340 320 330 340 350 360 370 pF1KE5 EPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLM :.. ::: . ::.: . :.::.: : . ::: :.::.::: .::: :: .. CCDS75 VPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHS 350 360 370 380 390 400 380 390 400 410 420 430 pF1KE5 DRPIFYYRGDTLMAATLGQHKAHFWTWTNSWEN--FR-QGIDFCPGQNVSGVTTHNLEDH :. .... . .. :. ... . : . . :. .: : :..: ... : CCDS75 DHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHH 410 420 430 440 450 460 440 450 460 470 480 490 pF1KE5 TKLPLIFHLGRDPGERFPLSFASAE-YQEALSRITSVVQQHQEALVPAQPQLNVCNWAVM ::.: :.:::.: :. :: . ... :. ..: .::..: :. ::. . CCDS75 DP-PLLFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWR 470 480 490 500 510 520 500 510 520 pF1KE5 NWAPPGCEKLGKCLTPPESIPKKCLWSH : : : . : :. :. CCDS75 PWLQPCCGPFPLCWCLREDDPQ 530 540 >>CCDS43334.1 ARSB gene_id:411|Hs108|chr5 (413 aa) initn: 509 init1: 139 opt: 537 Z-score: 644.3 bits: 128.5 E(32554): 1.5e-29 Smith-Waterman score: 638; 34.2% identity (62.3% similar) in 374 aa overlap (13-375:28-383) 10 20 30 40 pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD :::.:. : :: :: .::....:: ::.::.: CCDS43 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND 10 20 30 40 50 50 60 70 80 90 100 pF1KE5 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR .: .: : ::.:: .:: :.:. :.:. .:::.:::. ::::: ::.:. : CCDS43 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H-- 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE5 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN . : . . .: .:.:::.:::.:::....::::::: .: . : ..::: .:: CCDS43 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY-- 120 130 140 150 160 170 180 190 200 210 220 pF1KE5 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ .: : .. . : : : .: .. :: :. :.:. ..:. .: . CCDS43 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH 170 180 190 200 210 220 230 240 250 260 270 pF1KE5 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD ..:.::: :....: :. . :: :. ..: .:. : .:...:.. :.. CCDS43 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE5 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ . .:: .:..:::. .. ::.: :. : . .:::.: ... : : CCDS43 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE5 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMAAT ...: : : . : . :: . . .::... :. .: CCDS43 KNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE5 LGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPL CCDS43 SPYWPECSLLL 410 >>CCDS4043.1 ARSB gene_id:411|Hs108|chr5 (533 aa) initn: 552 init1: 139 opt: 537 Z-score: 642.5 bits: 128.6 E(32554): 1.8e-29 Smith-Waterman score: 675; 31.2% identity (57.0% similar) in 528 aa overlap (13-498:28-531) 10 20 30 40 pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGD :::.:. : :: :: .::....:: ::.::.: CCDS40 MGPRGAASLPRGPGPRRLLLPVVLPLLLLLLLAPPGSGA-GASRPPHLVFLLADDLGWND 10 20 30 40 50 50 60 70 80 90 100 pF1KE5 LGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHAR .: .: : ::.:: .:: :.:. :.:. .:::.:::. ::::: ::.:. : CCDS40 VGFHGSRIR-TPHLDALAAGGVLLDNYYT-QPLCTPSRSQLLTGRYQIRTGLQ----H-- 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE5 NAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPN . : . . .: .:.:::.:::.:::....::::::: .: . : ..::: .:: CCDS40 QIIWPCQP-SCVPLDEKLLPQLLKEAGYTTHMVGKWHLGMYRKECLPTRRGFDTYFGY-- 120 130 140 150 160 170 180 190 200 210 220 pF1KE5 CHFGPYDNKARPNIPVYRDWEMVGRYYEEF--PINLKTGEANL--TQIYLQEALDFIKRQ .: : .. . : : : .: .. :: :. :.:. ..:. .: . CCDS40 -LLGSEDYYSHERCTLI-DALNVTRCALDFRDGEEVATGYKNMYSTNIFTKRAIALITNH 170 180 190 200 210 220 230 240 250 260 270 pF1KE5 ARHHPFFLYWAVDATHAPVYAS----KP--FLGTSQRGRYGDAVREIDDSIGKILELLQD ..:.::: :....: :. . :: :. ..: .:. : .:...:.. :.. CCDS40 PPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHHYAGMVSLMDEAVGNVTAALKS 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE5 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQ . .:: .:..:::. .. ::.: :. : . .:::.: ... : : CCDS40 SGLWNNTVFIFSTDNGGQTLA----GGNNWPLRGRKWSLWEGGVRGVGFVASPLLKQKGV 290 300 310 320 330 340 340 350 360 370 380 pF1KE5 VSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDR--------PIFYYR ...: : : . : . :: . . .::... :. .: : : : CCDS40 KNRELIHISDWLPTLVKLARGHTNGTKPLDGFDVWKTISEGSPSPRIELLHNIDPNFVDS 350 360 370 380 390 400 390 400 410 420 pF1KE5 G----DTLMAA----TLGQHKA-----HFWTWTNSWENFRQGIDFC------PGQ-NVSG . ... : .: ...: : ..:. . : : :.: ::: CCDS40 SPCPRNSMAPAKDDSSLPEYSAFNTSVHAAIRHGNWK-LLTGYPGCGYWFPPPSQYNVSE 410 420 430 440 450 460 430 440 450 460 470 480 pF1KE5 VTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQ-P- . . . :: .: . ::: :: :: :: . .... : .: ... ::. : CCDS40 IPSSD--PPTKTLWLFDIDRDPEERHDLS---REYPHIVTKLLSRLQFYHKHSVPVYFPA 470 480 490 500 510 490 500 510 520 pF1KE5 QLNVCN-WAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH : :. :. :.: CCDS40 QDPRCDPKATGVWGPWM 520 530 >>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa) initn: 892 init1: 284 opt: 487 Z-score: 582.5 bits: 117.4 E(32554): 4e-26 Smith-Waterman score: 862; 37.4% identity (61.5% similar) in 478 aa overlap (29-472:34-486) 10 20 30 40 50 pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPN : ::....: :::::::::. ...: : CCDS11 LFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAETKDTAN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIP ::.::.::. : .:..: ::::::.:::::: .::: .:: . . :::.: CCDS11 LDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGV------TRNFAVTS--VGGLP 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 DSEQLLPELLKKAGYVSKIVGKWHLGHRPQFHPLKHGFDEWFGSPNCH-FG----P-YDN .: : :.:..::::. :.:::::::. ..:: .::: .:: : : .: : :.. CCDS11 LNETTLAEVLQQAGYVTGIIGKWHLGHHGSYHPNFRGFDYYFGIPYSHDMGCTDTPGYNH 120 130 140 150 160 170 180 190 200 210 pF1KE5 KARPNIP--------VYRD--WEMVGRYYE-----EFPINLKTGEANLTQIYLQEALDFI : : . :: ... :: : :.::.. :.: : ..: .:: CCDS11 PPCPACPQGDGPSRNLQRDCYTDVALPLYENLNIVEQPVNLSS----LAQKYAEKATQFI 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE5 KRQARH-HPFFLYWAVDATHAPVYASKPFLGTSQRGR--YGDAVREIDDSIGKILELLQD .: . .::.:: :. :.:. ... : .. ::: :: .. :.:. .:.: . . : CCDS11 QRASTSGRPFLLYVALAHMHVPLPVTQ--LPAAPRGRSLYGAGLWEMDSLVGQIKDKV-D 240 250 260 270 280 280 290 300 310 320 pF1KE5 LHVADNTFVFFTSDNGAALISAPEQGGSNGPFLC----------GKQTTFEGGMREPALA : .:::..::.::: . : .:: ::: .::::.::: : :::: CCDS11 HTVKENTFLWFTGDNGP-WAQKCELAGSVGPFTGFWQTRQGGSPAKQTTWEGGHRVPALA 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE5 WWPGHVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLLQGRLMDRPIFY .:::.: .. .: : :..:.: : .::: . :. : .::... .:. :: . CCDS11 YWPGRVPVNVTSTALLSVLDIFPTVVALAQASLPQGRRFDGVDVSEVLF-GRSQPGHRVL 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE5 YRGDTLMAATLGQHKAHFWTWTNSWENFRQGIDFCPGQNVSGVTTHNLEDHTKLPLIFHL .. .. :. .: . : : .. .. .: : .:. : :.::::.: CCDS11 FHPNSGAAGEFGALQ------TVRLERYKAFYITGGARACDGSTGPELQ-H-KFPLIFNL 410 420 430 440 450 450 460 470 480 490 500 pF1KE5 GRDPGERFPLSFASAEYQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKL : .: :: ..:::: .: .. .:. CCDS11 EDDTAEAVPLERGGAEYQAVLPEVRKVLADVLQDIANDNISSADYTQDPSVTPCCNPYQI 460 470 480 490 500 510 >>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa) initn: 857 init1: 272 opt: 427 Z-score: 509.6 bits: 104.1 E(32554): 4.6e-22 Smith-Waterman score: 836; 31.8% identity (57.9% similar) in 554 aa overlap (9-487:12-560) 10 20 30 40 50 pF1KE5 MAAVVAATRWW---QLLLVLSAAGMGASG-APQPPNILLLLMDDMGWGDLGVYGEPS : : .: ..:: : ..: . . ::::::. ::.: ::.: ::. . CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 RETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEI .:::.::.: .:. . . :: ::.:::::.:::: :.:.:. .. .. .: CCDS14 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS- 70 80 90 100 110 120 130 140 150 160 pF1KE5 VGGIPDSEQLLPELLKKAGYVSKIVGKWHLGHRPQ------FHPLKHGFDEWFGSP---- ::.: .: . ..::. ::.. ..:::::: . :::.::::...: : CCDS14 -GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLM 120 130 140 150 160 170 170 180 190 pF1KE5 -NCHFGPYDNKARPNIP-----VYRDWEMV------GRYYEEFPI--------------- .: ..: : :. ... .: :. . .:. CCDS14 GDCARWELSEK-RVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLL 180 190 200 210 220 230 200 210 220 230 pF1KE5 --------------------NLKTGEANL-----TQIYLQEALDFIKRQARHHPFFLYWA : : . : . :::. .:.::. .: ::.:. . CCDS14 LASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRN-KHGPFLLFVS 240 250 260 270 280 290 240 250 260 270 280 290 pF1KE5 VDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGA .: :. . . ::: : .: ::: :.:.: .:.::. :. ....:...::::.:. CCDS14 FLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG 300 310 320 330 340 350 300 310 320 330 340 pF1KE5 AL---ISAPEQGGSNGPFLCGK-QTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFT .: .. . :: :: . :: . .:::.: :.. ::: . ::.: . :.::.: CCDS14 SLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFP 360 370 380 390 400 410 350 360 370 380 390 400 pF1KE5 TSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYYRGDTLMAATLGQHKAHFWTWT : . ::: :.::.::: .::: :: .. :. .... . .. :. ... . : CCDS14 TVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWK 420 430 440 450 460 470 410 420 430 440 450 460 pF1KE5 NSWEN--FR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAE-YQ . . :. .: : :..: ... : ::.: :.:::.: :. :: . CCDS14 VHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDP-PLLFDLSRDPSETHILTPASEPVFY 480 490 500 510 520 530 470 480 490 500 510 520 pF1KE5 EALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH ... :. ..: .::..: :. ::. CCDS14 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 540 550 560 570 580 >>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa) initn: 857 init1: 272 opt: 427 Z-score: 509.3 bits: 104.1 E(32554): 4.8e-22 Smith-Waterman score: 836; 31.8% identity (57.9% similar) in 554 aa overlap (9-487:37-585) 10 20 30 pF1KE5 MAAVVAATRWW---QLLLVLSAAGMGASG-APQPPNIL : : .: ..:: : ..: . . :::: CCDS75 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNIL 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE5 LLLMDDMGWGDLGVYGEPSRETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIR ::. ::.: ::.: ::. . .:::.::.: .:. . . :: ::.:::::.:::: :.: CCDS75 LLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVR 70 80 90 100 110 120 100 110 120 130 140 pF1KE5 NGFYTTNAHARNAYTPQEIVGGIPDSEQLLPELLKKAGYVSKIVGKWHLGHRPQ------ .:. .. .. .: ::.: .: . ..::. ::.. ..:::::: . CCDS75 SGMVSSIGYRVLQWTGAS--GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHC 130 140 150 160 170 180 150 160 170 180 190 pF1KE5 FHPLKHGFDEWFGSP-----NCHFGPYDNKARPNIP-----VYRDWEMV------GRYYE :::.::::...: : .: ..: : :. ... .: :. . CCDS75 HHPLHHGFDHFYGMPFSLMGDCARWELSEK-RVNLEQKLNFLFQVLALVALTLVAGKLTH 190 200 210 220 230 240 200 210 pF1KE5 EFPI-----------------------------------NLKTGEANL-----TQIYLQE .:. : : . : . ::: CCDS75 LIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQE 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE5 ALDFIKRQARHHPFFLYWAVDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELL . .:.::. .: ::.:. . .: :. . . ::: : .: ::: :.:.: .:.::. : CCDS75 VASFLKRN-KHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTL 310 320 330 340 350 360 280 290 300 310 320 pF1KE5 QDLHVADNTFVFFTSDNGAAL---ISAPEQGGSNGPFLCGK-QTTFEGGMREPALAWWPG . ....:...::::.:..: .. . :: :: . :: . .:::.: :.. ::: CCDS75 DVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPG 370 380 390 400 410 420 330 340 350 360 370 380 pF1KE5 HVTAGQVSHQLGSIMDLFTTSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRPIFYYRG . ::.: . :.::.: : . ::: :.::.::: .::: :: .. :. .... CCDS75 VLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYC 430 440 450 460 470 480 390 400 410 420 430 440 pF1KE5 DTLMAATLGQHKAHFWTWTNSWEN--FR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHL . .. :. ... . : . . :. .: : :..: ... : ::.: : CCDS75 ERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDP-PLLFDL 490 500 510 520 530 540 450 460 470 480 490 500 pF1KE5 GRDPGERFPLSFASAE-YQEALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEK .:::.: :. :: . ... :. ..: .::..: :. ::. CCDS75 SRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGP 550 560 570 580 590 600 510 520 pF1KE5 LGKCLTPPESIPKKCLWSH CCDS75 FPLCWCLREDDPQ 610 >>CCDS43264.1 ARSJ gene_id:79642|Hs108|chr4 (599 aa) initn: 350 init1: 121 opt: 423 Z-score: 504.6 bits: 103.2 E(32554): 8.7e-22 Smith-Waterman score: 558; 26.9% identity (55.5% similar) in 517 aa overlap (31-517:76-572) 10 20 30 40 50 60 pF1KE5 MAAVVAATRWWQLLLVLSAAGMGASGAPQPPNILLLLMDDMGWGDLGVYGEPSRETPNLD :.....: ::.:. :.: .: . ::.:: CCDS43 WGQALEEEEEGALLAQAGEKLEPSTTSTSQPHLIFILADDQGFRDVGYHGSEIK-TPTLD 50 60 70 80 90 100 70 80 90 100 110 120 pF1KE5 RMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEIVGGIPDS ..::::. . :.: ..:.:.:::. ..::. :..:. : . : . . .: . CCDS43 KLAAEGVKLENYY-VQPICTPSRSQFITGKYQIHTGL----QH--SIIRPTQP-NCLPLD 110 120 130 140 150 130 140 150 160 170 pF1KE5 EQLLPELLKKAGYVSKIVGKWHLG-HRPQFHPLKHGFDEWFGSPNCHFGPYDNKARPNIP . ::. ::..:: ...::::::: .: . : ..::: .::: : : .. . . : CCDS43 NATLPQKLKEVGYSTHMVGKWHLGFYRKECMPTRRGFDTFFGSL-LGSGDYYTHYKCDSP 160 170 180 190 200 210 180 190 200 210 220 230 pF1KE5 VYRDWEMVGRYYEEFPINLKTGEANLTQIYLQEALDFIKRQARHHPFFLYWAVDATHAPV . ... .. . .: . ::.: :.. ... . .:.::: : .:.:.:. CCDS43 GMCGYDL--YENDNAAWDYDNGIYS-TQMYTQRVQQILASHNPTKPIFLYIAYQAVHSPL 220 230 240 250 260 270 240 250 260 270 280 290 pF1KE5 YASKPFLGTSQ------RGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGAAL : .. . : ::. . .:..:... :. .:......::::. CCDS43 QAPGRYFEHYRSIININRRRYAAMLSCLDEAINNVTLALKTYGFYNNSIIIYSSDNGG-- 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE5 ISAPEQGGSNGPFLCGKQTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFTTSLALA : :::: :. .: : .:::.: ... : . : : ..: : : . : ..:: CCDS43 --QPTAGGSNWPLRGSKGTYWEGGIRAVGFVHSPLLKNKGTVCKELVHITDWYPTLISLA 340 350 360 370 380 360 370 380 390 400 pF1KE5 GLTPPSDRAIDGLNLLPTLLQGRLMDRPIFYYRGDTLMA-ATLGQHKAHFWTWTNS---- : .:: .. :. .: : . . : ... : :. : . :... CCDS43 EGQIDEDIQLDGYDIWETISEGLRSPRVDILHNIDPIYTKAKNGSWAAGYGIWNTAIQSA 390 400 410 420 430 440 410 420 430 440 450 pF1KE5 -----WENFR--QGI-DFCPGQNVSGVTT---HNLE---DHTKLPLIFHLGRDPGERFPL :. . : :. : :. :.. :: . . : .:.. :: :: : CCDS43 IRVQHWKLLTGNPGYSDWVPPQSFSNLGPNRWHNERITLSTGKSVWLFNITADPYERVDL 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE5 SFASAEYQEALSRITSVVQQHQEALVPAQ-PQLNVCNWAVMN---WAPPGCEKLGKCLTP : .: .... ..: ... ::.. : . . .: :.: :. : CCDS43 S---NRYPGIVKKLLRRLSQFNKTAVPVRYPPKDPRSNPRLNGGVWGPWYKEETKKKKPS 510 520 530 540 550 560 520 pF1KE5 PESIPKKCLWSH .. :: CCDS43 KNQAEKKQKKSKKKKKKQQKAVSGSTCHSGVTCG 570 580 590 522 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:48:53 2016 done: Tue Nov 8 05:48:54 2016 Total Scan time: 2.770 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]