FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6750, 589 aa 1>>>pF1KE6750 589 - 589 aa - 589 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6920+/-0.000921; mu= 16.9258+/- 0.055 mean_var=75.2476+/-15.183, 0's: 0 Z-trim(106.6): 26 B-trim: 14 in 1/50 Lambda= 0.147852 statistics sampled from 9055 (9080) to 9055 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.649), E-opt: 0.2 (0.279), width: 16 Scan time: 2.850 The best scores are: opt bits E(32554) CCDS14122.1 ARSE gene_id:415|Hs108|chrX ( 589) 4147 894.3 0 CCDS75948.1 ARSE gene_id:415|Hs108|chrX ( 614) 4085 881.1 0 CCDS75949.1 ARSE gene_id:415|Hs108|chrX ( 544) 3724 804.1 0 CCDS35196.1 ARSD gene_id:414|Hs108|chrX ( 593) 2618 568.2 1.1e-161 CCDS35198.1 ARSH gene_id:347527|Hs108|chrX ( 562) 2428 527.6 1.6e-149 CCDS14123.1 ARSF gene_id:416|Hs108|chrX ( 590) 2357 512.5 6e-145 CCDS14127.1 STS gene_id:412|Hs108|chrX ( 583) 2065 450.2 3.4e-126 CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 ( 522) 426 100.6 5.3e-21 CCDS14100.2 ARSA gene_id:410|Hs108|chr22 ( 509) 421 99.5 1.1e-20 CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 ( 525) 353 85.0 2.6e-16 CCDS43334.1 ARSB gene_id:411|Hs108|chr5 ( 413) 350 84.3 3.3e-16 CCDS4043.1 ARSB gene_id:411|Hs108|chr5 ( 533) 350 84.4 4.1e-16 CCDS46736.1 ARSA gene_id:410|Hs108|chr22 ( 423) 339 82.0 1.7e-15 CCDS34275.1 ARSI gene_id:340075|Hs108|chr5 ( 569) 325 79.0 1.8e-14 >>CCDS14122.1 ARSE gene_id:415|Hs108|chrX (589 aa) initn: 4147 init1: 4147 opt: 4147 Z-score: 4779.2 bits: 894.3 E(32554): 0 Smith-Waterman score: 4147; 99.8% identity (100.0% similar) in 589 aa overlap (1-589:1-589) 10 20 30 40 50 60 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYGNNT ::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::: CCDS14 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 CARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 SYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 HIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 HIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLEN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 QLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 LAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 TPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 TPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMER 490 500 510 520 530 540 550 560 570 580 pF1KE6 VQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ 550 560 570 580 >>CCDS75948.1 ARSE gene_id:415|Hs108|chrX (614 aa) initn: 4082 init1: 4082 opt: 4085 Z-score: 4707.5 bits: 881.1 E(32554): 0 Smith-Waterman score: 4085; 98.6% identity (99.3% similar) in 589 aa overlap (1-589:26-614) 10 20 30 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISA ..: . ::::::::::::::::::::::::::: CCDS75 MRPVINRCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISA 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE6 SRPNILLLMADDLGIGDVGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLT :::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::: CCDS75 SRPNILLLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLT 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE6 GRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 GRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESA 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE6 SDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 SDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGK 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE6 LTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLI 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE6 LQEVASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LQEVASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILD 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE6 TLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 TLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRW 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE6 PGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 PGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMH 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE6 YCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 YCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFD 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE6 LSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCG 550 560 570 580 590 600 580 pF1KE6 PFPLCWCLREDDPQ :::::::::::::: CCDS75 PFPLCWCLREDDPQ 610 >>CCDS75949.1 ARSE gene_id:415|Hs108|chrX (544 aa) initn: 3762 init1: 3724 opt: 3724 Z-score: 4292.1 bits: 804.1 E(32554): 0 Smith-Waterman score: 3724; 100.0% identity (100.0% similar) in 527 aa overlap (63-589:18-544) 40 50 60 70 80 90 pF1KE6 ISASRPNILLLMADDLGIGDVGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAA :::::::::::::::::::::::::::::: CCDS75 MSGSRERDNMLHLHHSWTPNIDRLAEDGVKLTQHISAASLCTPSRAA 10 20 30 40 100 110 120 130 140 150 pF1KE6 FLTGRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 FLTGRYPVRSGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNC 50 60 70 80 90 100 160 170 180 190 200 210 pF1KE6 ESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ESASDHCHHPLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLV 110 120 130 140 150 160 220 230 240 250 260 270 pF1KE6 AGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 AGKLTHLIPVSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTT 170 180 190 200 210 220 280 290 300 310 320 330 pF1KE6 PLILQEVASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 PLILQEVASFLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGR 230 240 250 260 270 280 340 350 360 370 380 390 pF1KE6 ILDTLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ILDTLDVEGLSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGI 290 300 310 320 330 340 400 410 420 430 440 450 pF1KE6 FRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 FRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEF 350 360 370 380 390 400 460 470 480 490 500 510 pF1KE6 LMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LMHYCERFLHAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPL 410 420 430 440 450 460 520 530 540 550 560 570 pF1KE6 LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LFDLSRDPSETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQP 470 480 490 500 510 520 580 pF1KE6 CCGPFPLCWCLREDDPQ ::::::::::::::::: CCDS75 CCGPFPLCWCLREDDPQ 530 540 >>CCDS35196.1 ARSD gene_id:414|Hs108|chrX (593 aa) initn: 2676 init1: 2615 opt: 2618 Z-score: 3016.6 bits: 568.2 E(32554): 1.1e-161 Smith-Waterman score: 2618; 63.5% identity (82.8% similar) in 576 aa overlap (12-587:15-590) 10 20 30 40 50 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYG :. ::..: . : : . .: .:::::.:::::: ::.:::: CCDS35 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 NNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTG :::.::::::.:::.::.::::..:: :::::::::::::. :::: .: :::.:::.. CCDS35 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 ASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL .::::: ::::::.::...::::::::::: :.:: : .:::::::.::::.::::::.: CCDS35 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 MGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLL .:: . : . :. .: : ::: :::.::. .. :: : : . :. CCDS35 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLF 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE6 LASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSF . : : ... . .:.::::: .::::: ...:. :.:.:..:...:.::::::::.:. CCDS35 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE6 LHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGS :::::::.: ::::: :::::::::::::..:..:.... .::.:::. :::::::: CCDS35 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE6 LENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPT :: . :..: ::::::::::::::::::::::::::.::::::::::::::::::::::: CCDS35 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE6 VVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKV ::.:.::::::::::::..:.::: :. .: ::::.::: . ::::::::.: :..::: CCDS35 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKV 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE6 HFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQV :..:: :.:::::::::: :::: :: :.:: :::::::::::::.. ::: :::... : CCDS35 HYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAV 490 500 510 520 530 540 540 550 560 570 580 pF1KE6 MERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ . :: :: ::..:::::: :.. . .:.:::::::: ::.: : .. : CCDS35 IARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP 550 560 570 580 590 >>CCDS35198.1 ARSH gene_id:347527|Hs108|chrX (562 aa) initn: 2065 init1: 1642 opt: 2428 Z-score: 2797.9 bits: 527.6 E(32554): 1.6e-149 Smith-Waterman score: 2428; 60.8% identity (82.8% similar) in 553 aa overlap (36-587:5-556) 10 20 30 40 50 60 pF1KE6 HSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYGNNTMRTPN .::::.::::::::.::. :::::.. ::: CCDS35 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPN 10 20 30 70 80 90 100 110 120 pF1KE6 IDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGY-RVLQWTGASGGLPT ::::: .::.::::..:::.::::::::::::::.::::::. . :.. : :.:::::: CCDS35 IDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPT 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE6 NETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCARW :::::::.:...:: :::::::::::.: : .:::.:::.::: .:::.::.:..:: CCDS35 NETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQAS 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE6 ELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLASSYFV . : . :. :: . .:::: . :. :... . : : .. :: : :...: : CCDS35 KTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSS 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE6 GALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLHVHIPL .. . .:.::::: : .::: .... :.:.:. .:..: :. ::::: :::::: :: CCDS35 YGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPL 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE6 ITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLENQLGN :. ..:.:.: .: :::::::::::::.:::.:: : :.: ::.:::::.:: :: : CCDS35 ISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGA 280 290 300 310 320 330 370 380 390 400 410 420 pF1KE6 TQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVVRLAGG .: :::::::::::::::::::::::::::::.:: :::::.:::::::..::. ..:: CCDS35 VQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGG 340 350 360 370 380 390 430 440 450 460 470 480 pF1KE6 EVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVHFVTPVF . ::::::::.:.::: : :.:::::::.::: .::..::::.: .:.::.:.::: : CCDS35 ILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYVTPKF 400 410 420 430 440 450 490 500 510 520 530 540 pF1KE6 QPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVMERVQQA :::.::::: .: : :. :..::::::::.::::::. :.: .::.: .:..... : CCDS35 YPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAA 460 470 480 490 500 510 550 560 570 580 pF1KE6 VWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ . ::.:::.::: :.. ...::.:::::::: ::.: : .::: CCDS35 IREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP 520 530 540 550 560 >>CCDS14123.1 ARSF gene_id:416|Hs108|chrX (590 aa) initn: 2218 init1: 1855 opt: 2357 Z-score: 2715.7 bits: 512.5 E(32554): 6e-145 Smith-Waterman score: 2357; 59.2% identity (82.5% similar) in 559 aa overlap (33-587:25-579) 10 20 30 40 50 60 pF1KE6 HLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYGNNTMR . ..:::.:.:.:::::::.:::::.::: CCDS14 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 TPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASGGL ::.:::::..::.:::::::::::.:::.::::::::.::::::: . ::.: .. .:: CCDS14 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 PTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCA : ::::.: .::..::.:::::::: ::::.: ::.:::: ..:::..:::::.:. .: CCDS14 PLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSC- 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 RWELSEKRVNL--EQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS : . ..: :..: . :..:.. :::. :::. . : :. .:.: . ..::. CCDS14 -WPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWL-LIFSMILFIFLLGY 180 190 200 210 220 230 250 260 270 280 290 pF1KE6 SYFVGALI-VHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLH ..: . .. ::.:::.: :::::: .:. ....:. :::.:... :::: :::: CCDS14 AWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLH 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 VHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLE :: :: : ..: : : :::::::::::: :::.:::..: :: :.::.:::::::: :: CCDS14 VHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 NQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVV . :..: ::::::::::::::::::::::::: :::: .::::.: :::::::..:::. CCDS14 ARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 RLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRD-RGTMWKVH ..:: .::::::::.::.::: :...::.::::.::: .:::.:: .: :..::.: CCDS14 SVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAH 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVM .::::::: ..:.:: ..: ::::.:..:.:::::::::::::. ::::.::. :. CCDS14 YVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVI 480 490 500 510 520 530 540 550 560 570 580 pF1KE6 ERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ ..: .:. :::.:. :: ::..: : : ::.:::: ::.: : .:.. CCDS14 KKVANALKEHQETIVPVTYQLSEL-NQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR 540 550 560 570 580 590 >>CCDS14127.1 STS gene_id:412|Hs108|chrX (583 aa) initn: 1972 init1: 1972 opt: 2065 Z-score: 2379.2 bits: 450.2 E(32554): 3.4e-126 Smith-Waterman score: 2065; 53.7% identity (77.6% similar) in 577 aa overlap (15-585:8-575) 10 20 30 40 50 60 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYGNNT .: .: .: : : . ::::::.:.::::::::: :::::.: CCDS14 MPLRKMKIPFLLLFFLWEAESHA----ASRPNIILVMADDLGIGDPGCYGNKT 10 20 30 40 70 80 90 100 110 120 pF1KE6 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG .::::::::: :::::::..:. :::::::::.::::::::::.: :. .:..:: CCDS14 IRTPNIDRLASGGVKLTQHLAASPLCTPSRAAFMTGRYPVRSGMASWSRTGVFLFTASSG 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE6 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD ::::.: ::::.::..::.:.::::::::..:.: .: :::::::::..:::. .. . : CCDS14 GLPTDEITFAKLLKDQGYSTALIGKWHLGMSCHSKTDFCHHPLHHGFNYFYGISLTNLRD 110 120 130 140 150 160 190 200 210 220 230 pF1KE6 CARWELSEKRVNLEQKLNFL-FQVLALVALTLVAGKLTHLIPVSWMPVIWSALS-AVLLL : : : ... ..: :: .:..... :::.: . :. : . :..: : :.:.: CCDS14 CKPGEGSVFTTGF-KRLVFLPLQIVGVTLLTLAALNCLGLLHVP-LGVFFSLLFLAALIL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 ASSYFVGAL--IVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVS . :.: : . .::.:::. : .::: .. : . :.:.:..:: . :::: .: CCDS14 --TLFLGFLHYFRPLNCFMMRNYEIIQQPMSYDNLTQRLTVEAAQFIQRNTETPFLLVLS 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 FLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG .:::: :.. ..: ::: ::.::: :::::: ::.::. :: :.:.::::::::.:. CCDS14 YLHVHTALFSSKDFAGKSQHGVYGDAVEEMDWSVGQILNLLDELRLANDTLIYFTSDQGA 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 SLENQLGNTQ-YGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVF .:. .. . .:: ::::::::. ..::::::::::.::: :. ::. : :::: ::.: CCDS14 HVEEVSSKGEIHGGSNGIYKGGKA-NNWEGGIRVPGILRWPRVIQAGQKIDEPTSNMDIF 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 PTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMW :::..:::. .:.::.:::.::.::: : .:.::::::.:::. .:.:.::: .. ..: CCDS14 PTVAKLAGAPLPEDRIIDGRDLMPLLEGKSQRSDHEFLFHYCNAYLNAVRWHPQNSTSIW 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE6 KVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFY :. : :: :.: :...:.. .:: ::: :.:::::::::.:.:: : . ::::::: :: CCDS14 KAFFFTPNFNPVGSNGCFATHVCFCFGSYVTHHDPPLLFDISKDPRERNPLTPASEPRFY 470 480 490 500 510 520 540 550 560 570 580 pF1KE6 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPL-CWCLREDDPQ .... .:.:. .: .:: :: :.. . .:.:::: :: : : : :: CCDS14 EILKVMQEAADRHTQTLPEVPDQFSWNNFLWKPWLQLCCPSTGLSCQCDREKQDKRLSR 530 540 550 560 570 580 >>CCDS10970.1 GALNS gene_id:2588|Hs108|chr16 (522 aa) initn: 856 init1: 271 opt: 426 Z-score: 490.5 bits: 100.6 E(32554): 5.3e-21 Smith-Waterman score: 859; 31.9% identity (56.3% similar) in 583 aa overlap (12-589:9-516) 10 20 30 40 50 60 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYGNNT : : .: ..:: : ..: . . ::::::. ::.: ::.: ::. . CCDS10 MAAVVAATRWW---QLLLVLSAAGMGASG-APQPPNILLLLMDDMGWGDLGVYGEPS 10 20 30 40 50 70 80 90 100 110 pF1KE6 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS- .:::.::.: .:. . . :: ::.:::::.:::: :.:.:. .. .. .: CCDS10 RETPNLDRMAAEGLLFPNFYSANPLCSPSRAALLTGRLPIRNGFYTTNAHARNAYTPQEI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 -GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLM ::.: .: . ..::. ::.. ..:::::: . :::.::::...: : CCDS10 VGGIPDSEQLLPELLKKAGYVSKIVGKWHLGHRPQ------FHPLKHGFDEWFGSP---- 120 130 140 150 160 180 190 200 210 220 230 pF1KE6 GDCARWELSEK-RVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLL .: ..: : :. ... .: :. . .:. CCDS10 -NCHFGPYDNKARPNIP-----VYRDWEMV------GRYYEEFPI--------------- 170 180 190 240 250 260 270 280 290 pF1KE6 LASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRN-KHGPFLLFVS : : . : . :::. .:.::. .: ::.:. . CCDS10 --------------------NLKTGEANL-----TQIYLQEALDFIKRQARHHPFFLYWA 200 210 220 230 300 310 320 330 340 350 pF1KE6 FLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG .: :. . . ::: : .: ::: :.:.: .:.::. :. ....:...::::.:. CCDS10 VDATHAPVYASKPFLGTSQRGRYGDAVREIDDSIGKILELLQDLHVADNTFVFFTSDNGA 240 250 260 270 280 290 360 370 380 390 400 410 pF1KE6 SLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFP .: .. . :: :: . :: . .:::.: :.. ::: . ::.: . :.::.: CCDS10 AL---ISAPEQGGSNGPFLCGK-QTTFEGGMREPALAWWPGHVTAGQVSHQLGSIMDLFT 300 310 320 330 340 420 430 440 450 460 470 pF1KE6 TVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWK : . ::: :.::.::: .::: :: .. :. ...: : :: :. .. .: CCDS10 TSLALAGLTPPSDRAIDGLNLLPTLL-QGRLMDRP-IFYYRGDTLMAATLGQH-KAHFWT 350 360 370 380 390 400 480 490 500 510 520 530 pF1KE6 VHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDP-PLLFDLSRDPSETHILTPASEPVFY :. .: : :..: ... : ::.: :.:::.: :. :: . CCDS10 WTNSWENFR-QGIDFCPGQNVSGVTTHNLEDHTKLPLIFHLGRDPGERFPLSFASAE-YQ 410 420 430 440 450 460 540 550 560 570 580 pF1KE6 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ ... :. ..: .::..: :. ::. . : : : . : :. :. CCDS10 EALSRITSVVQQHQEALVPAQPQLNVCNWAVMNWAPPGCEKLGKCLTPPESIPKKCLWSH 470 480 490 500 510 520 >>CCDS14100.2 ARSA gene_id:410|Hs108|chr22 (509 aa) initn: 813 init1: 291 opt: 421 Z-score: 484.9 bits: 99.5 E(32554): 1.1e-20 Smith-Waterman score: 835; 32.6% identity (56.5% similar) in 577 aa overlap (20-589:8-508) 10 20 30 40 50 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRP-NILLLMADDLGIGDVGCYGNN ..::.:: . ....:: ::.:..::::: ::.::::. CCDS14 MSMGAPRSLLLALA----AGLAVARPPNIVLIFADDLGYGDLGCYGHP 10 20 30 40 60 70 80 90 100 110 pF1KE6 TMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGAS . :::.:.:: :...:. .:::::::::.:::: ::: :: .. .. CCDS14 SSTTPNLDQLAAGGLRFTDFYVPVSLCTPSRAALLTGRLPVRMGMYPGVLV-----PSSR 50 60 70 80 90 120 130 140 150 160 170 pF1KE6 GGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL-M :::: .:.: :..: .:: ::. ::::::.. :.: : :.:: .: :.:.: . CCDS14 GGLPLEEVTVAEVLAARGYLTGMAGKWHLGVGPEGA----FLPPHQGFHRFLGIPYSHDQ 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE6 GDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLL : : . . . .:: . :.:. .. : :.: : CCDS14 GPCQNLTCFPPATPCDGGCD-----QGLVPIPLLANLSVEAQP-PWLPG----------L 160 170 180 190 240 250 260 270 280 290 pF1KE6 ASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFL . :.. : . :: :: . ::.:. . CCDS14 EARYMAFAHDLMADA---------------QR----------------QDRPFFLYYASH 200 210 220 300 310 320 330 340 350 pF1KE6 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSL :.: : .. ..: .: .: .::.. :.: :: .. .. :: . ::. ::.:.: CCDS14 HTHYPQFSGQSFAERSGRGPFGDSLMELDAAVGTLMTAIGDLGLLEETLVIFTADNGP-- 230 240 250 260 270 280 360 370 380 390 400 410 pF1KE6 ENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTV . . :: .:. . ::: .:::.: :.. ::: . : : : .: .:..::. CCDS14 --ETMRMSRGGCSGLLRCGKGTT-YEGGVREPALAFWPGHIAPG-VTHELASSLDLLPTL 290 300 310 320 330 340 420 430 440 450 460 470 pF1KE6 VRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKVH . :::. .: . ..:: :: ::::::.. : .. :. : . .: : .:.: CCDS14 AALAGAPLP-NVTLDGFDLSPLLLGTGK-SPRQSLFFY-PSYPDEVRGVFAVRTGKYKAH 350 360 370 380 390 480 490 500 510 520 530 pF1KE6 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHIL---TPASEPVFY : : : . . . .: . ... :.::::.:::.::.:.. : . .. : CCDS14 FFT---QGSAHSDTTADPACHA-SSSLTAHEPPLLYDLSKDPGENYNLLGGVAGATPEVL 400 410 420 430 440 450 540 550 560 570 580 pF1KE6 QVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGP--FPLCWCLREDDPQ :.....: . . ... : :. : :. : :: :: : : : . ::. CCDS14 QALKQLQLLKAQLDAAVTFGPSQVAR-GE--DPALQICCHPGCTPRPACCHCPDPHA 460 470 480 490 500 >>CCDS11676.1 ARSG gene_id:22901|Hs108|chr17 (525 aa) initn: 765 init1: 218 opt: 353 Z-score: 406.3 bits: 85.0 E(32554): 2.6e-16 Smith-Waterman score: 741; 29.4% identity (57.5% similar) in 562 aa overlap (30-582:28-522) 10 20 30 40 50 60 pF1KE6 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDVGCYGNNT :. ...::.....:::.: ::.: .: CCDS11 MGWLFLKVLLAGVSFSGFLYPLVDFCISGKTRGQKPNFVIILADDMGWGDLGANWAET 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 MRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASG : :.:..: .:..... .::: :.::::..:::: .:.:.. ... . . : CCDS11 KDTANLDKMASEGMRFVDFHAAASTCSPSRASLLTGRLGLRNGVTRNFA------VTSVG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 GLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGD ::: ::::.:..:.. ::.::.::::::: . .:: .:::...:.:.: CCDS11 GLPLNETTLAEVLQQAGYVTGIIGKWHLGHH------GSYHPNFRGFDYYFGIPYSHDMG 120 130 140 150 160 190 200 210 220 230 240 pF1KE6 CARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS : : . : .: : : . . : . CCDS11 C----------------------------TDTPG-YNH-PPCPACP--QGDGPSRNLQRD 170 180 190 250 260 270 280 290 pF1KE6 SYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHG--PFLLFVSFL : :: :..: .:.:::. .. . .....:..: . . ::::.:.. CCDS11 CYTDVALP------LYENLNIVEQPVNLSSLAQKYAEKATQFIQRASTSGRPFLLYVALA 200 210 220 230 240 300 310 320 330 340 350 pF1KE6 HVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGG-S :.:.:: . . . ..::: .. ::: .::.: : .: . ....:...::.:.: . CCDS11 HMHVPLPVTQLPAAPRGRSLYGAGLWEMDSLVGQIKDKVD-HTVKENTFLWFTGDNGPWA 250 260 270 280 290 300 360 370 380 390 400 410 pF1KE6 LENQLGNTQYGGWNGIYKGGKG-----MGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLM . .:... : ..:... .: . :::: :::.. ::: .:.. . :.. CCDS11 QKCELAGS-VGPFTGFWQTRQGGSPAKQTTWEGGHRVPALAYWPGRVPVNVTSTALLSVL 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE6 DVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRG :.::::: :: . .:: : .:: :. .:.: .: :. :.: : : CCDS11 DIFPTVVALAQASLPQGRRFDGVDVSEVLFGRSQ-PGHRVLFHPNSGAAGEFGALQTVRL 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE6 TMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEP .:. ..: :: :: : : .. .: ::.:.: : .:. : .. CCDS11 ERYKAFYITG-----GARACDGST-----GPEL-QHKFPLIFNLEDDTAEAVPLERGGAE 430 440 450 460 470 540 550 560 570 580 pF1KE6 VFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPL-CWCLREDDPQ . :. .:.... . . .. ... : . :::.:. . : : CCDS11 -YQAVLPEVRKVLADVLQDIAND--NISSADYTQDPSVTPCCNPYQIACRCQAA 480 490 500 510 520 589 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 16:00:44 2016 done: Tue Nov 8 16:00:45 2016 Total Scan time: 2.850 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]