FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0077, 1203 aa
1>>>pF1KE0077 1203 - 1203 aa - 1203 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7132+/-0.000856; mu= 16.8393+/- 0.052
mean_var=118.9727+/-24.233, 0's: 0 Z-trim(111.1): 23 B-trim: 292 in 1/50
Lambda= 0.117585
statistics sampled from 12114 (12133) to 12114 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.707), E-opt: 0.2 (0.373), width: 16
Scan time: 4.370
The best scores are: opt bits E(32554)
CCDS516.1 PTCH2 gene_id:8643|Hs108|chr1 (1203) 8077 1382.0 0
CCDS53312.1 PTCH2 gene_id:8643|Hs108|chr1 (1146) 7644 1308.5 0
CCDS43851.1 PTCH1 gene_id:5727|Hs108|chr9 (1296) 2010 352.8 3.2e-96
CCDS47996.1 PTCH1 gene_id:5727|Hs108|chr9 (1381) 2010 352.8 3.4e-96
CCDS47995.1 PTCH1 gene_id:5727|Hs108|chr9 (1446) 2010 352.8 3.5e-96
CCDS6714.1 PTCH1 gene_id:5727|Hs108|chr9 (1447) 2010 352.8 3.5e-96
CCDS11878.1 NPC1 gene_id:4864|Hs108|chr18 (1278) 408 81.0 2e-14
CCDS43575.1 NPC1L1 gene_id:29881|Hs108|chr7 (1332) 372 74.9 1.5e-12
CCDS5491.1 NPC1L1 gene_id:29881|Hs108|chr7 (1359) 372 74.9 1.5e-12
>>CCDS516.1 PTCH2 gene_id:8643|Hs108|chr1 (1203 aa)
initn: 8077 init1: 8077 opt: 8077 Z-score: 7403.6 bits: 1382.0 E(32554): 0
Smith-Waterman score: 8077; 100.0% identity (100.0% similar) in 1203 aa overlap (1-1203:1-1203)
10 20 30 40 50 60
pF1KE0 MTRSPPLRELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSLGCGIQRHCGKVLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 MTRSPPLRELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSLGCGIQRHCGKVLF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 LGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 LGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTAR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 QEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 QEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 FPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQLLEELGPFASLEGFRELLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 FPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQLLEELGPFASLEGFRELLDK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 AQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 AQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 GMARDPQGELLRAEALQSTFLLMSPRQLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 GMARDPQGELLRAEALQSTFLLMSPRQLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 QLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDCAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 QLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDCAQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 SQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 SQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 ALPGTPLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 ALPGTPLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 AVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDGTVPVGIAHLTATV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 AVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDGTVPVGIAHLTATV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 QAFTHCEASSQHVVTILPPQAHLVPPPSDPLGSELFSPGGSTRDLLGQEEETRQKAACKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 QAFTHCEASSQHVVTILPPQAHLVPPPSDPLGSELFSPGGSTRDLLGQEEETRQKAACKS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 LPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 LPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 TKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRALFDLHQRFSSLKAVLPPPATQAPRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 TKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRALFDLHQRFSSLKAVLPPPATQAPRT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE0 WLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSEDGALAYKLLIQTGDAQEPLDFSQLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 WLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSEDGALAYKLLIQTGDAQEPLDFSQLT
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE0 TRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGENLRIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 TRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGENLRIP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE0 PAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFWEQYLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 PAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFWEQYLGL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE0 RRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLVLAMMTVELFGIMGFLGIKLSAIPVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 RRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLVLAMMTVELFGIMGFLGIKLSAIPVV
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE0 ILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHALEHTFAPVTDGAISTLLGLLMLAGSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 ILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHALEHTFAPVTDGAISTLLGLLMLAGSH
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE0 FDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPPPEVIQMYKESPEILSPPAPQGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 FDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPPPEVIQMYKESPEILSPPAPQGGG
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE0 LRWGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRGPGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS51 LRWGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRGPGP
1150 1160 1170 1180 1190 1200
pF1KE0 ATG
:::
CCDS51 ATG
>>CCDS53312.1 PTCH2 gene_id:8643|Hs108|chr1 (1146 aa)
initn: 7644 init1: 7644 opt: 7644 Z-score: 7006.9 bits: 1308.5 E(32554): 0
Smith-Waterman score: 7644; 100.0% identity (100.0% similar) in 1142 aa overlap (1-1142:1-1142)
10 20 30 40 50 60
pF1KE0 MTRSPPLRELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSLGCGIQRHCGKVLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MTRSPPLRELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSLGCGIQRHCGKVLF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 LGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTAR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 QEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 FPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQLLEELGPFASLEGFRELLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQLLEELGPFASLEGFRELLDK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 AQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 AQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 GMARDPQGELLRAEALQSTFLLMSPRQLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GMARDPQGELLRAEALQSTFLLMSPRQLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 QLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDCAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDCAQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 SQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 ALPGTPLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ALPGTPLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 AVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDGTVPVGIAHLTATV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 AVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDGTVPVGIAHLTATV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 QAFTHCEASSQHVVTILPPQAHLVPPPSDPLGSELFSPGGSTRDLLGQEEETRQKAACKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QAFTHCEASSQHVVTILPPQAHLVPPPSDPLGSELFSPGGSTRDLLGQEEETRQKAACKS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 LPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 TKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRALFDLHQRFSSLKAVLPPPATQAPRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRALFDLHQRFSSLKAVLPPPATQAPRT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE0 WLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSEDGALAYKLLIQTGDAQEPLDFSQLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 WLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSEDGALAYKLLIQTGDAQEPLDFSQLT
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE0 TRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGENLRIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGENLRIP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE0 PAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFWEQYLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFWEQYLGL
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE0 RRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLVLAMMTVELFGIMGFLGIKLSAIPVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLVLAMMTVELFGIMGFLGIKLSAIPVV
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE0 ILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHALEHTFAPVTDGAISTLLGLLMLAGSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHALEHTFAPVTDGAISTLLGLLMLAGSH
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE0 FDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPPPEVIQMYKESPEILSPPAPQGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPPPEVIQMYKESPEILSPPAPQGGG
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE0 LRWGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRGPGP
::
CCDS53 LRPEEI
>>CCDS43851.1 PTCH1 gene_id:5727|Hs108|chr9 (1296 aa)
initn: 3291 init1: 1216 opt: 2010 Z-score: 1840.9 bits: 352.8 E(32554): 3.2e-96
Smith-Waterman score: 3975; 54.9% identity (81.1% similar) in 1086 aa overlap (110-1159:2-1081)
80 90 100 110 120 130
pF1KE0 TNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTARQEGENILTPEALGLHLQAA
.. :..::: ..:: :.:: ::: ::..:
CCDS43 MFNPQLMIQTPKEEGANVLTTEALLQHLDSA
10 20 30
140 150 160 170 180 190
pF1KE0 LTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKLFPCVILTPLDCFWEGAKLQ
: ::.:.: .:...: :...::::: . :.:.....:: :.::.:.:::::::::::::
CCDS43 LQASRVHVYMYNRQWKLEHLCYKSGELITETGYMDQIIEYLYPCLIITPLDCFWEGAKLQ
40 50 60 70 80 90
200 210 220 230 240 250
pF1KE0 GGSAYLPGRPDIQWTNLDPEQLLEELGPFA-SLEGFRELLDKAQVGQAYVGRPCLHPDDL
.:.::: :.: ..:::.:: ..:::: . ......:.:.::.::..:. ::::.: :
CCDS43 SGTAYLLGKPPLRWTNFDPLEFLEELKKINYQVDSWEEMLNKAEVGHGYMDRPCLNPADP
100 110 120 130 140 150
260 270 280 290 300 310
pF1KE0 HCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLGGMARDPQGELLRAEALQS
:: .:::..: . ..: :.:::::.:.:.:::::::..:: ... :.:. :.:::.
CCDS43 DCPATAPNKNSTKPLDMALVLNGGCHGLSRKYMHWQEELIVGGTVKNSTGKLVSAHALQT
160 170 180 190 200 210
320 330 340 350 360 370
pF1KE0 TFLLMSPRQLYEHFRG-DYQTHDIGWSEEQASTVLQAWQRRFVQLAQEALPENASQQIHA
: ::.:.:.::::.: .: .: :.:.:..:...:.:::: .:....... .:..:.. .
CCDS43 MFQLMTPKQMYEHFKGYEYVSH-INWNEDKAAAILEAWQRTYVEVVHQSVAQNSTQKVLS
220 230 240 250 260 270
380 390 400 410 420 430
pF1KE0 FSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDCAQSQGSVGLAGVLLVALAV
:..:::::::..::.::. ::..::::::::::.:::::::..:::.:::::::::::.:
CCDS43 FTTTTLDDILKSFSDVSVIRVASGYLLMLAYACLTMLRWDCSKSQGAVGLAGVLLVALSV
280 290 300 310 320 330
440 450 460 470 480 490
pF1KE0 ASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTEALPGT--PLQERMGECL
:.:::::.:.::.:::::::::::::::.::::::::::::.:. . :...: ::::
CCDS43 AAGLGLCSLIGISFNAATTQVLPFLALGVGVDDVFLLAHAFSETGQNKRIPFEDRTGECL
340 350 360 370 380 390
500 510 520 530 540 550
pF1KE0 QRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFVAVMLVFPAILSLDLR
.:::.::.::::.:..::.::::.:::::::::::::.:: .:. :.:.::::::.::
CCDS43 KRTGASVALTSISNVTAFFMAALIPIPALRAFSLQAAVVVVFNFAMVLLIFPAILSMDLY
400 410 420 430 440 450
560 570 580 590
pF1KE0 RRHCQRLDVLCCFSSPCSAQVIQILPQELGDG------TVPV-----GIAHLT-----AT
::. .:::..:::.::: ..:::. :: : . : ..:: : .:
CCDS43 RREDRRLDIFCCFTSPCVSRVIQVEPQAYTDTHDNTRYSPPPPYSSHSFAHETQITMQST
460 470 480 490 500 510
600 610 620 630 640 650
pF1KE0 VQAFTHCEASSQHVVTILPPQAHLVPPP----SDPLGSELFSPGGSTRDLLGQEEETRQK
:: :. . .. : :.... : .: :. . .::::::.: .. .
CCDS43 VQLRTEYDPHTHVYYTTAEPRSEISVQPVTVTQDTLSCQSPESTSSTRDLLSQFSDSSLH
520 530 540 550 560 570
660 670 680 690 700 710
pF1KE0 AACKSLPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALTD
: ::..:.:. ::. ..::.::. .::..:. :: .:::.::::.: :.::: :::
CCDS43 --CLEPPCTKWTLSSFAEKHYAPFLLKPKAKVVVIFLFLGLLGVSLYGTTRVRDGLDLTD
580 590 600 610 620
720 730 740 750 760 770
pF1KE0 VVPRGTKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRALFDLHQRFSSLKAVLPPPAT
.::: :.:. :..::..:::.:.. .::: . :: . :. :.:::. ::..: :.
CCDS43 IVPRETREYDFIAAQFKYFSFYNMYIVTQKA-DYPNIQHLLYDLHRSFSNVKYVMLEENK
630 640 650 660 670 680
780 790 800 810 820 830
pF1KE0 QAPRTWLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSEDGALAYKLLIQTGDAQEPLD
: :. ::::.:.::::.: :::.:: .:.: ..:.:::.::.::::::.:::. ..:.:
CCDS43 QLPKMWLHYFRDWLQGLQDAFDSDWETGKIMPNNYKNGSDDGVLAYKLLVQTGSRDKPID
690 700 710 720 730 740
840 850 860 870 880 890
pF1KE0 FSQLTTRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGE
.:::: ..::: .:.: : ::. ::.:::.::.. ::::::. : :::.::: : :
CCDS43 ISQLTKQRLVDADGIINPSAFYIYLTAWVSNDPVAYAASQANIRPHRPEWVHDKADYMPE
750 760 770 780 790 800
900 910 920 930 940 950
pF1KE0 N-LRIPPAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFW
. :::: :.:.:.::::: : ::. :.::::::: .:. :.. . :. .::.: :::::
CCDS43 TRLRIPAAEPIEYAQFPFYLNGLRDTSDFVEAIEKVRTICSNYTSLGLSSYPNGYPFLFW
810 820 830 840 850 860
960 970 980 990 1000 1010
pF1KE0 EQYLGLRRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLVLAMMTVELFGIMGFLGIKL
:::.:::. .:: . ..:.:::::::..::::::::.::.:::.:::::::.::..::::
CCDS43 EQYIGLRHWLLLFISVVLACTFLVCAVFLLNPWTAGIIVMVLALMTVELFGMMGLIGIKL
870 880 890 900 910 920
1020 1030 1040 1050 1060 1070
pF1KE0 SAIPVVILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHALEHTFAPVTDGAISTLLGLL
::.:::::.:::::::::::::::.:::. :..: ::. :::: :::: :::.:::::.:
CCDS43 SAVPVVILIASVGIGVEFTVHVALAFLTAIGDKNRRAVLALEHMFAPVLDGAVSTLLGVL
930 940 950 960 970 980
1080 1090 1100 1110 1120
pF1KE0 MLAGSHFDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPPPEVI------QMYKESP
:::::.::::::::::.:..::.::.:.::::::::::..:: ::: .. ::
CCDS43 MLAGSEFDFIVRYFFAVLAILTILGVLNGLVLLPVLLSFFGPYPEVSPANGLNRLPTPSP
990 1000 1010 1020 1030 1040
1130 1140 1150 1160 1170 1180
pF1KE0 EILSPP-----APQGGGLRWGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPW
: :: : : . :..:: . ...:.:
CCDS43 E--PPPSVVRFAMPPGHTHSGSDSSDSEYSSQTTVSGLSEELRHYEAQQGAGGPAHQVIV
1050 1060 1070 1080 1090 1100
1190 1200
pF1KE0 SPAATSSGNLSSRGPGPATG
CCDS43 EATENPVFAHSTVVHPESRHHPPSNPRQQPHLDSGSLPPGRQGQQPRRDPPREGLWPPPY
1110 1120 1130 1140 1150 1160
>>CCDS47996.1 PTCH1 gene_id:5727|Hs108|chr9 (1381 aa)
initn: 3662 init1: 1216 opt: 2010 Z-score: 1840.5 bits: 352.8 E(32554): 3.4e-96
Smith-Waterman score: 4346; 55.8% identity (81.6% similar) in 1165 aa overlap (31-1159:8-1166)
10 20 30 40 50 60
pF1KE0 MTRSPPLRELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSLGCGIQRHCGKVLF
:::::::: :: :::.::: ::..::: :
CCDS47 MGKATGRKAPLWLRAKFQRLLFKLGCYIQKNCGKFLV
10 20 30
70 80 90 100 110 120
pF1KE0 LGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTAR
.::: :::.:.::. : .:::.:.::::::.:::.::.::..:.:::: .. :..::: .
CCDS47 VGLLIFGAFAVGLKAANLETNVEELWVEVGGRVSRELNYTRQKIGEEAMFNPQLMIQTPK
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE0 QEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKL
.:: :.:: ::: ::..:: ::.:.: .:...: :...::::: . :.:.....:: :
CCDS47 EEGANVLTTEALLQHLDSALQASRVHVYMYNRQWKLEHLCYKSGELITETGYMDQIIEYL
100 110 120 130 140 150
190 200 210 220 230
pF1KE0 FPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQLLEELGPFA-SLEGFRELLD
.::.:.:::::::::::::.:.::: :.: ..:::.:: ..:::: . ......:.:.
CCDS47 YPCLIITPLDCFWEGAKLQSGTAYLLGKPPLRWTNFDPLEFLEELKKINYQVDSWEEMLN
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE0 KAQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLL
::.::..:. ::::.: : :: .:::..: . ..: :.:::::.:.:.:::::::..
CCDS47 KAEVGHGYMDRPCLNPADPDCPATAPNKNSTKPLDMALVLNGGCHGLSRKYMHWQEELIV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE0 GGMARDPQGELLRAEALQSTFLLMSPRQLYEHFRG-DYQTHDIGWSEEQASTVLQAWQRR
:: ... :.:. :.:::. : ::.:.:.::::.: .: .: :.:.:..:...:.::::
CCDS47 GGTVKNSTGKLVSAHALQTMFQLMTPKQMYEHFKGYEYVSH-INWNEDKAAAILEAWQRT
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE0 FVQLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDC
.:....... .:..:.. .:..:::::::..::.::. ::..::::::::::.:::::::
CCDS47 YVEVVHQSVAQNSTQKVLSFTTTTLDDILKSFSDVSVIRVASGYLLMLAYACLTMLRWDC
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE0 AQSQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAF
..:::.:::::::::::.::.:::::.:.::.:::::::::::::::.::::::::::::
CCDS47 SKSQGAVGLAGVLLVALSVAAGLGLCSLIGISFNAATTQVLPFLALGVGVDDVFLLAHAF
400 410 420 430 440 450
480 490 500 510 520 530
pF1KE0 TEALPGT--PLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVG
.:. . :...: ::::.:::.::.::::.:..::.::::.:::::::::::::.::
CCDS47 SETGQNKRIPFEDRTGECLKRTGASVALTSISNVTAFFMAALIPIPALRAFSLQAAVVVV
460 470 480 490 500 510
540 550 560 570 580 590
pF1KE0 CTFVAVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDG------TVP
.:. :.:.::::::.:: ::. .:::..:::.::: ..:::. :: : . :
CCDS47 FNFAMVLLIFPAILSMDLYRREDRRLDIFCCFTSPCVSRVIQVEPQAYTDTHDNTRYSPP
520 530 540 550 560 570
600 610 620 630
pF1KE0 V-----GIAHLT-----ATVQAFTHCEASSQHVVTILPPQAHLVPPP----SDPLGSELF
..:: : .::: :. . .. : :.... : .: :. .
CCDS47 PPYSSHSFAHETQITMQSTVQLRTEYDPHTHVYYTTAEPRSEISVQPVTVTQDTLSCQSP
580 590 600 610 620 630
640 650 660 670 680 690
pF1KE0 SPGGSTRDLLGQEEETRQKAACKSLPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGAL
.::::::.: .. . : ::..:.:. ::. ..::.::. .::..:. :: .:
CCDS47 ESTSSTRDLLSQFSDSSLH--CLEPPCTKWTLSSFAEKHYAPFLLKPKAKVVVIFLFLGL
640 650 660 670 680 690
700 710 720 730 740 750
pF1KE0 LGLSLYGATLVQDGLALTDVVPRGTKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRAL
::.::::.: :.::: :::.::: :.:. :..::..:::.:.. .::: . :: . :. :
CCDS47 LGVSLYGTTRVRDGLDLTDIVPRETREYDFIAAQFKYFSFYNMYIVTQKA-DYPNIQHLL
700 710 720 730 740 750
760 770 780 790 800 810
pF1KE0 FDLHQRFSSLKAVLPPPATQAPRTWLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSED
.:::. ::..: :. : :. ::::.:.::::.: :::.:: .:.: ..:.:::.:
CCDS47 YDLHRSFSNVKYVMLEENKQLPKMWLHYFRDWLQGLQDAFDSDWETGKIMPNNYKNGSDD
760 770 780 790 800 810
820 830 840 850 860 870
pF1KE0 GALAYKLLIQTGDAQEPLDFSQLTTRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQA
:.::::::.:::. ..:.:.:::: ..::: .:.: : ::. ::.:::.::.. :::::
CCDS47 GVLAYKLLVQTGSRDKPIDISQLTKQRLVDADGIINPSAFYIYLTAWVSNDPVAYAASQA
820 830 840 850 860 870
880 890 900 910 920 930
pF1KE0 NFYPPPPEWLHDKYDTTGEN-LRIPPAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACA
:. : :::.::: : :. :::: :.:.:.::::: : ::. :.::::::: .:. :.
CCDS47 NIRPHRPEWVHDKADYMPETRLRIPAAEPIEYAQFPFYLNGLRDTSDFVEAIEKVRTICS
880 890 900 910 920 930
940 950 960 970 980 990
pF1KE0 EAGQAGVHAYPSGSPFLFWEQYLGLRRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLV
. . :. .::.: ::::::::.:::. .:: . ..:.:::::::..::::::::.::.:
CCDS47 NYTSLGLSSYPNGYPFLFWEQYIGLRHWLLLFISVVLACTFLVCAVFLLNPWTAGIIVMV
940 950 960 970 980 990
1000 1010 1020 1030 1040 1050
pF1KE0 LAMMTVELFGIMGFLGIKLSAIPVVILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHAL
::.:::::::.::..::::::.:::::.:::::::::::::::.:::. :..: ::. ::
CCDS47 LALMTVELFGMMGLIGIKLSAVPVVILIASVGIGVEFTVHVALAFLTAIGDKNRRAVLAL
1000 1010 1020 1030 1040 1050
1060 1070 1080 1090 1100 1110
pF1KE0 EHTFAPVTDGAISTLLGLLMLAGSHFDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILG
:: :::: :::.:::::.::::::.::::::::::.:..::.::.:.::::::::::..:
CCDS47 EHMFAPVLDGAVSTLLGVLMLAGSEFDFIVRYFFAVLAILTILGVLNGLVLLPVLLSFFG
1060 1070 1080 1090 1100 1110
1120 1130 1140 1150 1160
pF1KE0 PPPEVI------QMYKESPEILSPP-----APQGGGLRWGASSSLPQSFARVTTSMTVAI
: ::: .. ::: :: : : . :..:: . ...:.:
CCDS47 PYPEVSPANGLNRLPTPSPE--PPPSVVRFAMPPGHTHSGSDSSDSEYSSQTTVSGLSEE
1120 1130 1140 1150 1160 1170
1170 1180 1190 1200
pF1KE0 HPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRGPGPATG
CCDS47 LRHYEAQQGAGGPAHQVIVEATENPVFAHSTVVHPESRHHPPSNPRQQPHLDSGSLPPGR
1180 1190 1200 1210 1220 1230
>>CCDS47995.1 PTCH1 gene_id:5727|Hs108|chr9 (1446 aa)
initn: 3662 init1: 1216 opt: 2010 Z-score: 1840.2 bits: 352.8 E(32554): 3.5e-96
Smith-Waterman score: 4346; 55.8% identity (81.6% similar) in 1165 aa overlap (31-1159:73-1231)
10 20 30 40 50 60
pF1KE0 MTRSPPLRELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSLGCGIQRHCGKVLF
:::::::: :: :::.::: ::..::: :
CCDS47 GEEEEENGGEEKDDRGDKETRSDKGKATGRKAPLWLRAKFQRLLFKLGCYIQKNCGKFLV
50 60 70 80 90 100
70 80 90 100 110 120
pF1KE0 LGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTAR
.::: :::.:.::. : .:::.:.::::::.:::.::.::..:.:::: .. :..::: .
CCDS47 VGLLIFGAFAVGLKAANLETNVEELWVEVGGRVSRELNYTRQKIGEEAMFNPQLMIQTPK
110 120 130 140 150 160
130 140 150 160 170 180
pF1KE0 QEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKL
.:: :.:: ::: ::..:: ::.:.: .:...: :...::::: . :.:.....:: :
CCDS47 EEGANVLTTEALLQHLDSALQASRVHVYMYNRQWKLEHLCYKSGELITETGYMDQIIEYL
170 180 190 200 210 220
190 200 210 220 230
pF1KE0 FPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQLLEELGPFA-SLEGFRELLD
.::.:.:::::::::::::.:.::: :.: ..:::.:: ..:::: . ......:.:.
CCDS47 YPCLIITPLDCFWEGAKLQSGTAYLLGKPPLRWTNFDPLEFLEELKKINYQVDSWEEMLN
230 240 250 260 270 280
240 250 260 270 280 290
pF1KE0 KAQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHGFSHKFMHWQEELLL
::.::..:. ::::.: : :: .:::..: . ..: :.:::::.:.:.:::::::..
CCDS47 KAEVGHGYMDRPCLNPADPDCPATAPNKNSTKPLDMALVLNGGCHGLSRKYMHWQEELIV
290 300 310 320 330 340
300 310 320 330 340 350
pF1KE0 GGMARDPQGELLRAEALQSTFLLMSPRQLYEHFRG-DYQTHDIGWSEEQASTVLQAWQRR
:: ... :.:. :.:::. : ::.:.:.::::.: .: .: :.:.:..:...:.::::
CCDS47 GGTVKNSTGKLVSAHALQTMFQLMTPKQMYEHFKGYEYVSH-INWNEDKAAAILEAWQRT
350 360 370 380 390 400
360 370 380 390 400 410
pF1KE0 FVQLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRWDC
.:....... .:..:.. .:..:::::::..::.::. ::..::::::::::.:::::::
CCDS47 YVEVVHQSVAQNSTQKVLSFTTTTLDDILKSFSDVSVIRVASGYLLMLAYACLTMLRWDC
410 420 430 440 450 460
420 430 440 450 460 470
pF1KE0 AQSQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAHAF
..:::.:::::::::::.::.:::::.:.::.:::::::::::::::.::::::::::::
CCDS47 SKSQGAVGLAGVLLVALSVAAGLGLCSLIGISFNAATTQVLPFLALGVGVDDVFLLAHAF
470 480 490 500 510 520
480 490 500 510 520 530
pF1KE0 TEALPGT--PLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIVVG
.:. . :...: ::::.:::.::.::::.:..::.::::.:::::::::::::.::
CCDS47 SETGQNKRIPFEDRTGECLKRTGASVALTSISNVTAFFMAALIPIPALRAFSLQAAVVVV
530 540 550 560 570 580
540 550 560 570 580 590
pF1KE0 CTFVAVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDG------TVP
.:. :.:.::::::.:: ::. .:::..:::.::: ..:::. :: : . :
CCDS47 FNFAMVLLIFPAILSMDLYRREDRRLDIFCCFTSPCVSRVIQVEPQAYTDTHDNTRYSPP
590 600 610 620 630 640
600 610 620 630
pF1KE0 V-----GIAHLT-----ATVQAFTHCEASSQHVVTILPPQAHLVPPP----SDPLGSELF
..:: : .::: :. . .. : :.... : .: :. .
CCDS47 PPYSSHSFAHETQITMQSTVQLRTEYDPHTHVYYTTAEPRSEISVQPVTVTQDTLSCQSP
650 660 670 680 690 700
640 650 660 670 680 690
pF1KE0 SPGGSTRDLLGQEEETRQKAACKSLPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGAL
.::::::.: .. . : ::..:.:. ::. ..::.::. .::..:. :: .:
CCDS47 ESTSSTRDLLSQFSDSSLH--CLEPPCTKWTLSSFAEKHYAPFLLKPKAKVVVIFLFLGL
710 720 730 740 750
700 710 720 730 740 750
pF1KE0 LGLSLYGATLVQDGLALTDVVPRGTKEHAFLSAQLRYFSLYEVALVTQGGFDYAHSQRAL
::.::::.: :.::: :::.::: :.:. :..::..:::.:.. .::: . :: . :. :
CCDS47 LGVSLYGTTRVRDGLDLTDIVPRETREYDFIAAQFKYFSFYNMYIVTQKA-DYPNIQHLL
760 770 780 790 800 810
760 770 780 790 800 810
pF1KE0 FDLHQRFSSLKAVLPPPATQAPRTWLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSED
.:::. ::..: :. : :. ::::.:.::::.: :::.:: .:.: ..:.:::.:
CCDS47 YDLHRSFSNVKYVMLEENKQLPKMWLHYFRDWLQGLQDAFDSDWETGKIMPNNYKNGSDD
820 830 840 850 860 870
820 830 840 850 860 870
pF1KE0 GALAYKLLIQTGDAQEPLDFSQLTTRKLVDREGLIPPELFYMGLTVWVSSDPLGLAASQA
:.::::::.:::. ..:.:.:::: ..::: .:.: : ::. ::.:::.::.. :::::
CCDS47 GVLAYKLLVQTGSRDKPIDISQLTKQRLVDADGIINPSAFYIYLTAWVSNDPVAYAASQA
880 890 900 910 920 930
880 890 900 910 920 930
pF1KE0 NFYPPPPEWLHDKYDTTGEN-LRIPPAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACA
:. : :::.::: : :. :::: :.:.:.::::: : ::. :.::::::: .:. :.
CCDS47 NIRPHRPEWVHDKADYMPETRLRIPAAEPIEYAQFPFYLNGLRDTSDFVEAIEKVRTICS
940 950 960 970 980 990
940 950 960 970 980 990
pF1KE0 EAGQAGVHAYPSGSPFLFWEQYLGLRRCFLLAVCILLVCTFLVCALLLLNPWTAGLIVLV
. . :. .::.: ::::::::.:::. .:: . ..:.:::::::..::::::::.::.:
CCDS47 NYTSLGLSSYPNGYPFLFWEQYIGLRHWLLLFISVVLACTFLVCAVFLLNPWTAGIIVMV
1000 1010 1020 1030 1040 1050
1000 1010 1020 1030 1040 1050
pF1KE0 LAMMTVELFGIMGFLGIKLSAIPVVILVASVGIGVEFTVHVALGFLTTQGSRNLRAAHAL
::.:::::::.::..::::::.:::::.:::::::::::::::.:::. :..: ::. ::
CCDS47 LALMTVELFGMMGLIGIKLSAVPVVILIASVGIGVEFTVHVALAFLTAIGDKNRRAVLAL
1060 1070 1080 1090 1100 1110
1060 1070 1080 1090 1100 1110
pF1KE0 EHTFAPVTDGAISTLLGLLMLAGSHFDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILG
:: :::: :::.:::::.::::::.::::::::::.:..::.::.:.::::::::::..:
CCDS47 EHMFAPVLDGAVSTLLGVLMLAGSEFDFIVRYFFAVLAILTILGVLNGLVLLPVLLSFFG
1120 1130 1140 1150 1160 1170
1120 1130 1140 1150 1160
pF1KE0 PPPEVI------QMYKESPEILSPP-----APQGGGLRWGASSSLPQSFARVTTSMTVAI
: ::: .. ::: :: : : . :..:: . ...:.:
CCDS47 PYPEVSPANGLNRLPTPSPE--PPPSVVRFAMPPGHTHSGSDSSDSEYSSQTTVSGLSEE
1180 1190 1200 1210 1220 1230
1170 1180 1190 1200
pF1KE0 HPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRGPGPATG
CCDS47 LRHYEAQQGAGGPAHQVIVEATENPVFAHSTVVHPESRHHPPSNPRQQPHLDSGSLPPGR
1240 1250 1260 1270 1280 1290
>>CCDS6714.1 PTCH1 gene_id:5727|Hs108|chr9 (1447 aa)
initn: 3662 init1: 1216 opt: 2010 Z-score: 1840.2 bits: 352.8 E(32554): 3.5e-96
Smith-Waterman score: 4357; 55.4% identity (80.9% similar) in 1187 aa overlap (12-1159:53-1232)
10 20 30
pF1KE0 MTRSPPLRELPPSYTPPARTAAPQILAGSL---KAPLWLRA
::: : : :: :. ::::::::
CCDS67 APGRPAGGGRRRRTGGLRRAAAPDRDYLHRPSYCDAA-FALEQISKGKATGRKAPLWLRA
30 40 50 60 70 80
40 50 60 70 80 90
pF1KE0 YFQGLLFSLGCGIQRHCGKVLFLGLLAFGALALGLRMAIIETNLEQLWVEVGSRVSQELH
:: :::.::: ::..::: : .::: :::.:.::. : .:::.:.::::::.:::.::.
CCDS67 KFQRLLFKLGCYIQKNCGKFLVVGLLIFGAFAVGLKAANLETNVEELWVEVGGRVSRELN
90 100 110 120 130 140
100 110 120 130 140 150
pF1KE0 YTKEKLGEEAAYTSQMLIQTARQEGENILTPEALGLHLQAALTASKVQVSLYGKSWDLNK
::..:.:::: .. :..::: ..:: :.:: ::: ::..:: ::.:.: .:...: :..
CCDS67 YTRQKIGEEAMFNPQLMIQTPKEEGANVLTTEALLQHLDSALQASRVHVYMYNRQWKLEH
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE0 ICYKSGVPLIENGMIERMIEKLFPCVILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDP
.::::: . :.:.....:: :.::.:.:::::::::::::.:.::: :.: ..:::.::
CCDS67 LCYKSGELITETGYMDQIIEYLYPCLIITPLDCFWEGAKLQSGTAYLLGKPPLRWTNFDP
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE0 EQLLEELGPFA-SLEGFRELLDKAQVGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAH
..:::: . ......:.:.::.::..:. ::::.: : :: .:::..: . ..:
CCDS67 LEFLEELKKINYQVDSWEEMLNKAEVGHGYMDRPCLNPADPDCPATAPNKNSTKPLDMAL
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE0 ELSGGCHGFSHKFMHWQEELLLGGMARDPQGELLRAEALQSTFLLMSPRQLYEHFRG-DY
:.:::::.:.:.:::::::..:: ... :.:. :.:::. : ::.:.:.::::.: .:
CCDS67 VLNGGCHGLSRKYMHWQEELIVGGTVKNSTGKLVSAHALQTMFQLMTPKQMYEHFKGYEY
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE0 QTHDIGWSEEQASTVLQAWQRRFVQLAQEALPENASQQIHAFSSTTLDDILHAFSEVSAA
.: :.:.:..:...:.:::: .:....... .:..:.. .:..:::::::..::.::.
CCDS67 VSH-INWNEDKAAAILEAWQRTYVEVVHQSVAQNSTQKVLSFTTTTLDDILKSFSDVSVI
390 400 410 420 430 440
400 410 420 430 440 450
pF1KE0 RVVGGYLLMLAYACVTMLRWDCAQSQGSVGLAGVLLVALAVASGLGLCALLGITFNAATT
::..::::::::::.:::::::..:::.:::::::::::.::.:::::.:.::.::::::
CCDS67 RVASGYLLMLAYACLTMLRWDCSKSQGAVGLAGVLLVALSVAAGLGLCSLIGISFNAATT
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE0 QVLPFLALGIGVDDVFLLAHAFTEALPGT--PLQERMGECLQRTGTSVVLTSINNMAAFL
:::::::::.::::::::::::.:. . :...: ::::.:::.::.::::.:..::.
CCDS67 QVLPFLALGVGVDDVFLLAHAFSETGQNKRIPFEDRTGECLKRTGASVALTSISNVTAFF
510 520 530 540 550 560
520 530 540 550 560 570
pF1KE0 MAALVPIPALRAFSLQAAIVVGCTFVAVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSA
::::.:::::::::::::.:: .:. :.:.::::::.:: ::. .:::..:::.::: .
CCDS67 MAALIPIPALRAFSLQAAVVVVFNFAMVLLIFPAILSMDLYRREDRRLDIFCCFTSPCVS
570 580 590 600 610 620
580 590 600 610
pF1KE0 QVIQILPQELGDG------TVPV-----GIAHLT-----ATVQAFTHCEASSQHVVTILP
.:::. :: : . : ..:: : .::: :. . .. :
CCDS67 RVIQVEPQAYTDTHDNTRYSPPPPYSSHSFAHETQITMQSTVQLRTEYDPHTHVYYTTAE
630 640 650 660 670 680
620 630 640 650 660 670
pF1KE0 PQAHLVPPP----SDPLGSELFSPGGSTRDLLGQEEETRQKAACKSLPCARWNLAHFARY
:.... : .: :. . .::::::.: .. . : ::..:.:. ::.
CCDS67 PRSEISVQPVTVTQDTLSCQSPESTSSTRDLLSQFSDSSLH--CLEPPCTKWTLSSFAEK
690 700 710 720 730
680 690 700 710 720 730
pF1KE0 QFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRGTKEHAFLSAQLRYF
..::.::. .::..:. :: .:::.::::.: :.::: :::.::: :.:. :..::..::
CCDS67 HYAPFLLKPKAKVVVIFLFLGLLGVSLYGTTRVRDGLDLTDIVPRETREYDFIAAQFKYF
740 750 760 770 780 790
740 750 760 770 780 790
pF1KE0 SLYEVALVTQGGFDYAHSQRALFDLHQRFSSLKAVLPPPATQAPRTWLHYYRNWLQGIQA
:.:.. .::: . :: . :. :.:::. ::..: :. : :. ::::.:.::::.:
CCDS67 SFYNMYIVTQKA-DYPNIQHLLYDLHRSFSNVKYVMLEENKQLPKMWLHYFRDWLQGLQD
800 810 820 830 840 850
800 810 820 830 840 850
pF1KE0 AFDQDWASGRITRHSYRNGSEDGALAYKLLIQTGDAQEPLDFSQLTTRKLVDREGLIPPE
:::.:: .:.: ..:.:::.::.::::::.:::. ..:.:.:::: ..::: .:.: :
CCDS67 AFDSDWETGKIMPNNYKNGSDDGVLAYKLLVQTGSRDKPIDISQLTKQRLVDADGIINPS
860 870 880 890 900 910
860 870 880 890 900 910
pF1KE0 LFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGEN-LRIPPAQPLEFAQFPFL
::. ::.:::.::.. ::::::. : :::.::: : :. :::: :.:.:.:::::
CCDS67 AFYIYLTAWVSNDPVAYAASQANIRPHRPEWVHDKADYMPETRLRIPAAEPIEYAQFPFY
920 930 940 950 960 970
920 930 940 950 960 970
pF1KE0 LRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFWEQYLGLRRCFLLAVCILLV
: ::. :.::::::: .:. :.. . :. .::.: ::::::::.:::. .:: . ..:.
CCDS67 LNGLRDTSDFVEAIEKVRTICSNYTSLGLSSYPNGYPFLFWEQYIGLRHWLLLFISVVLA
980 990 1000 1010 1020 1030
980 990 1000 1010 1020 1030
pF1KE0 CTFLVCALLLLNPWTAGLIVLVLAMMTVELFGIMGFLGIKLSAIPVVILVASVGIGVEFT
:::::::..::::::::.::.:::.:::::::.::..::::::.:::::.::::::::::
CCDS67 CTFLVCAVFLLNPWTAGIIVMVLALMTVELFGMMGLIGIKLSAVPVVILIASVGIGVEFT
1040 1050 1060 1070 1080 1090
1040 1050 1060 1070 1080 1090
pF1KE0 VHVALGFLTTQGSRNLRAAHALEHTFAPVTDGAISTLLGLLMLAGSHFDFIVRYFFAALT
:::::.:::. :..: ::. :::: :::: :::.:::::.::::::.::::::::::.:.
CCDS67 VHVALAFLTAIGDKNRRAVLALEHMFAPVLDGAVSTLLGVLMLAGSEFDFIVRYFFAVLA
1100 1110 1120 1130 1140 1150
1100 1110 1120 1130 1140
pF1KE0 VLTLLGLLHGLVLLPVLLSILGPPPEVI------QMYKESPEILSPP-----APQGGGLR
.::.::.:.::::::::::..:: ::: .. ::: :: : : .
CCDS67 ILTILGVLNGLVLLPVLLSFFGPYPEVSPANGLNRLPTPSPE--PPPSVVRFAMPPGHTH
1160 1170 1180 1190 1200 1210
1150 1160 1170 1180 1190 1200
pF1KE0 WGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRGPGPAT
:..:: . ...:.:
CCDS67 SGSDSSDSEYSSQTTVSGLSEELRHYEAQQGAGGPAHQVIVEATENPVFAHSTVVHPESR
1220 1230 1240 1250 1260 1270
>>CCDS11878.1 NPC1 gene_id:4864|Hs108|chr18 (1278 aa)
initn: 678 init1: 201 opt: 408 Z-score: 372.3 bits: 81.0 E(32554): 2e-14
Smith-Waterman score: 654; 24.3% identity (50.6% similar) in 1115 aa overlap (38-1116:329-1253)
10 20 30 40 50 60
pF1KE0 RELPPSYTPPARTAAPQILAGSLKAPLWLRAYFQGLLFSL----GCGIQRHCGKVLFLGL
: :.: : : : :. : :.:..:
CCDS11 VSEYTPIDSNIAFSVNASDKGEASCCDPVSAAFEGCLRRLFTRWGSFCVRNPGCVIFFSL
300 310 320 330 340 350
70 80 90 100 110 120
pF1KE0 LAFGALALGLRMAIIETNLEQLWVEVGSRVSQELHYTKEKLGEEAAYTSQMLIQTARQEG
. . : . :: .. . :: .:: .:.. : .: ...: . ...:: :
CCDS11 VFITACSSGLVFVRVTTNPVDLWSAPSSQARLEKEYFDQHFGPF--FRTEQLIIRAPLTD
360 370 380 390 400 410
130 140 150 160 170 180
pF1KE0 ENILTPEALGLHLQAALTASKVQVSLYGKSWDLNKICYKSGVPLIENGMIERMIEKLFPC
..: : : . . ..... . :: .: :::
CCDS11 KHIYQPYPSGADVP---FGPPLDIQILHQVLDL-QIA-------IEN-------------
420 430 440 450
190 200 210 220 230 240
pF1KE0 VILTPLDCFWEGAKLQGGSAYLPGRPDIQWTNLDPEQL-LEELGPFASLEGFRELLDKAQ
: . : : . :: :: . :.: . :. . ... . .::. .
CCDS11 -ITASYDN--ETVTLQ----------DICLAPLSPYNTNCTILSVLNYFQNSHSVLDHKK
460 470 480 490
250 260 270 280 290 300
pF1KE0 VGQAYVGRPCLHPDDLHCPPSAPNHHSRQAPNVAHELSGGCHG-FSHKFMHWQEELLLGG
:. . : :.: :: : . .. :. : : :. . : :.:::
CCDS11 -GDDFFVYADYHTHFLYCV-RAPA--SLNDTSLLHD---PCLGTFGGPVFPW---LVLGG
500 510 520 530 540
310 320 330 340 350 360
pF1KE0 MARDPQGELLRAEALQSTFLLMSPRQLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFVQ
. : :. : :: :: : . : ... . :::...:..
CCDS11 Y--DDQN-YNNATALVITF----PVNNY-------------YNDTEKLQRAQAWEKEFIN
550 560 570 580
370 380 390 400 410
pF1KE0 LAQEALPENASQQIHAFSSTTLDDILHAFSEVSAARVVGGYLLMLAYACVTMLRW-DC--
.... .: . : . ...: :. :. .. :: .: .:. : ... . .:
CCDS11 FVKNY--KNPNLTISFTAERSIEDELNRESDSDVFTVVISYAIMFLYISLALGHMKSCRR
590 600 610 620 630 640
420 430 440 450 460 470
pF1KE0 --AQSQGSVGLAGVLLVALAVASGLGLCALLGITFNAATTQVLPFLALGIGVDDVFLLAH
..:. :.:.::.:.: .:: .::. . .:. .. . .:.:::.:..:::..:.:..
CCDS11 LLVDSKVSLGIAGILIVLSSVACSLGVFSYIGLPLTLIVIEVIPFLVLAVGVDNIFILVQ
650 660 670 680 690 700
480 490 500 510 520 530
pF1KE0 AFT--EALPGTPLQERMGECLQRTGTSVVLTSINNMAAFLMAALVPIPALRAFSLQAAIV
:. : : : :....:. : ... :. :.:... .::...:: .::...::: :...
CCDS11 AYQRDERLQGETLDQQLGRVLGEVAPSMFLSSFSETVAFFLGALSVMPAVHTFSLFAGLA
710 720 730 740 750 760
540 550 560 570 580 590
pF1KE0 VGCTFVAVMLVFPAILSLDLRRRHCQRLDVLCCFSSPCSAQVIQILPQELGDGTVPVGIA
: :. . : ..:.::..:.. .:::..:: . :. :::
CCDS11 VFIDFLLQITCFVSLLGLDIKRQEKNRLDIFCCVRG---AE----------DGT------
770 780 790 800
600 610 620 630 640 650
pF1KE0 HLTATVQAFTHCEASSQHVVTILPPQAHLVPPPSDPLGSELFSPGGSTRDLLGQEEETRQ
.::: : ::
CCDS11 ----SVQASESC----------------------------LF------------------
810
660 670 680 690 700 710
pF1KE0 KAACKSLPCARWNLAHFARYQFAPLLLQSHAKAIVLVLFGALLGLSLYGATLVQDGLALT
.: . ...::::.. . ::...: ..:..:. . :. :: .
CCDS11 ---------------RFFKNSYSPLLLKDWMRPIVIAIFVGVLSFSIAVLNKVDIGLDQS
820 830 840 850 860
720 730 740 750 760
pF1KE0 DVVPRGTKEHAFLSAQLRYFSLYE-VALVTQGGFDYAHS--QRALFD---------LHQR
.: . .... .:. : .: . : ::. : : . ..:
CCDS11 LSMPDDSYMVDYFKSISQYLHAGPPVYFVLEEGHDYTSSKGQNMVCGGMGCNNDSLVQQI
870 880 890 900 910 920
770 780 790 800 810 820
pF1KE0 FSSLKAVLPPPATQAPRTWLHYYRNWLQGIQAAFDQDWASGRITRHSYRNGSEDGALAYK
:.. . :: .:. : .:.. .. : :: .. :.:
CCDS11 FNAAQLDNYTRIGFAPSSWIDDYFDWVKPQSSCCRVD----NIT-DQFCNASV-------
930 940 950 960 970
830 840 850 860 870 880
pF1KE0 LLIQTGDAQEPLDFSQLTTRKLVDREGLIPPEL--FYMGLTVWVSSDPLGLAASQANFYP
.: . . : :. :: :. :. : ...:..: :
CCDS11 -----------VDPACVRCRPLTP-EGKQRPQGGDFMRFLPMFLSDNP----------NP
980 990 1000
890 900 910 920 930 940
pF1KE0 PPPEWLHDKYDTTGENLRIPPAQPLEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQA
. : : ... :. . . . . : :: .:::..:.. :: ... ..
CCDS11 KCGKGGHAAY-SSAVNILLGHGTRVGATYFMTYHTVLQTSADFIDALKKARLIASNVTET
1010 1020 1030 1040 1050 1060
950 960 970 980 990
pF1KE0 -GVHA-----YPSGSPFLFWEQYLGLRRCFLLAVCILLVCTFLVCALLL-LNPWTAGLIV
:... .: . ..:.:::: . .. . . : ::: .:: . :.: ..
CCDS11 MGINGSAYRVFPYSVFYVFYEQYLTIIDDTIFNLGVSLGAIFLVTMVLLGCELWSAVIMC
1070 1080 1090 1100 1110 1120
1000 1010 1020 1030 1040 1050
pF1KE0 LVLAMMTVELFGIMGFLGIKLSAIPVVILVASVGIGVEFTVHVALGF-LTTQGSRNLRAA
..::. :..::.: . ::.:.:. .: :: : ::.::: :.. .: .. .::: ::
CCDS11 ATIAMVLVNMFGVMWLWGISLNAVSLVNLVMSCGISVEFCSHITRAFTVSMKGSRVERAE
1130 1140 1150 1160 1170 1180
1060 1070 1080 1090 1100 1110
pF1KE0 HALEHTFAPVTDG-AISTLLGLLMLAGSHFDFIVRYFFAALTVLTLLGLLHGLVLLPVLL
.:: : . : .: ... . :...:: .. ... ..: ...::: :::..:::::
CCDS11 EALAHMGSSVFSGITLTKFGGIVVLAFAKSQIFQIFYFRMYLAMVLLGATHGLIFLPVLL
1190 1200 1210 1220 1230 1240
1120 1130 1140 1150 1160 1170
pF1KE0 SILGPPPEVIQMYKESPEILSPPAPQGGGLRWGASSSLPQSFARVTTSMTVAIHPPPLPG
: .::
CCDS11 SYIGPSVNKAKSCATEERYKGTERERLLNF
1250 1260 1270
>>CCDS43575.1 NPC1L1 gene_id:29881|Hs108|chr7 (1332 aa)
initn: 684 init1: 227 opt: 372 Z-score: 339.0 bits: 74.9 E(32554): 1.5e-12
Smith-Waterman score: 649; 26.7% identity (53.4% similar) in 865 aa overlap (297-1132:554-1285)
270 280 290 300 310 320
pF1KE0 HHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLGGMARDPQGELLRAEALQSTFLLMSPR
: .::. .: :::: ::
CCDS43 YCANAPLTFKDGTALALSCMADYGAPVFPFLAIGGYKGKDYSE---AEALIMTF------
530 540 550 560 570
330 340 350 360 370 380
pF1KE0 QLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFVQLAQEALPENASQQIHAFSSTTLDDI
.: .. :: . . :: ..:.:::.. . : .. . : . . .:. :
CCDS43 SLNNYPAGDPRLAQAKLWEEAFLEEMRAFQRRMAGMFQVTFMAERSLEDEINRTTAEDLP
580 590 600 610 620 630
390 400 410 420 430 440
pF1KE0 LHAFSEVSAARVVGGYLLMLAYACVTMLRWD--CAQSQGSVGLAGVLLVALAVASGLGLC
. : : . :. .:... : .. :. ..:....::.:: .: :: ...:.
CCDS43 IFATSYI----VI---FLYISLALGSYSSWSRVMVDSKATLGLGGVAVVLGAVMAAMGFF
640 650 660 670 680
450 460 470 480 490 500
pF1KE0 ALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTEA--LPGTPLQERMGECLQRTGTSV
. ::: . . ::.:::.:..:.:..:... . . :: : . ..:. : :.. :.
CCDS43 SYLGIRSSLVILQVVPFLVLSVGADNIFIFVLEYQRLPRRPGEPREVHIGRALGRVAPSM
690 700 710 720 730 740
510 520 530 540 550 560
pF1KE0 VLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFVAVMLVFPAILSLDLRRRHCQRL
.: :... :...::.:.::.:.:.: ....: :. : .: :.:::: .:.. .::
CCDS43 LLCSLSEAICFFLGALTPMPAVRTFALTSGLAVILDFLLQMSAFVALLSLDSKRQEASRL
750 760 770 780 790 800
570 580 590 600 610 620
pF1KE0 DVLCCFSSPCSAQVIQILPQELGDGTVPVGIAHLTATVQAFTHCEASSQHVVTILPPQAH
:: :: . ::::
CCDS43 DVCCC-----------VKPQEL--------------------------------------
810
630 640 650 660 670 680
pF1KE0 LVPPPSDPLGSELFSPGGSTRDLLGQEEETRQKAACKSLPCARWNLAHFARYQFAPLLLQ
:::.. : ::: ::: .::.::.
CCDS43 --PPPGQGEGL-----------LLG----FFQKA-------------------YAPFLLH
820 830 840
690 700 710 720 730 740
pF1KE0 SHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRGTKEHAFLSAQLRYFSL-YEVAL
....::.:: ::.:.:::. .. :: ..:. . .. ::: . : .
CCDS43 WITRGVVLLLFLALFGVSLYSMCHISVGLDQELALPKDSYLLDYFLFLNRYFEVGAPVYF
850 860 870 880 890 900
750 760 770 780
pF1KE0 VTQGGFDYAH--SQRAL--------FDLHQRFSSLKAVLPPPATQA-P-RTWLHYYRNWL
:: :.... .. :. :.. :... . .: . : : .:. . .::
CCDS43 VTTLGYNFSSEAGMNAICSSAGCNNFSFTQKIQ-YATEFPEQSYLAIPASSWVDDFIDWL
910 920 930 940 950 960
790 800 810 820 830 840
pF1KE0 QGIQAAFDQDWASGRITRHSYRNGSEDGALAYK--LLIQTGDAQEPLD-FSQLTTRKLVD
.. . . :: .. .. .. .. : . : :... .. : . : :
CCDS43 T--PSSCCRLYISGP-NKDKFCPSTVNSLNCLKNCMSITMGSVRPSVEQFHKYLPWFLND
970 980 990 1000 1010
850 860 870 880 890 900
pF1KE0 REGLIPPE--LFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGENLRIPPAQP
: .. :. : .. .: ..:: ::. .. : :... : : : :: :.
CCDS43 RPNIKCPKGGLAAYSTSVNLTSDGQVLASRFMAYHKP----LKNSQDYT-EALRA--ARE
1020 1030 1040 1050 1060 1070
910 920 930 940 950 960
pF1KE0 LEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSPFLFWEQYLGL--RR
: . . :::. . . :. : ...: .:.:::: . .
CCDS43 L----------AANITADL-RKVPGTDPA--------FEVFPYTITNVFYEQYLTILPEG
1080 1090 1100 1110
970 980 990 1000 1010 1020
pF1KE0 CFLLAVCILLVCTFLVCALLLLNPWTAGLI-VLVLAMMTVELFGIMGFLGIKLSAIPVVI
:.:..: :: :: : ::: .::. .: ..:. :. :.:.. ::. .:. ..
CCDS43 LFMLSLC--LVPTFAVSCLLLGLDLRSGLLNLLSIVMILVDTVGFMALWGISYNAVSLIN
1120 1130 1140 1150 1160 1170
1030 1040 1050 1060 1070
pF1KE0 LVASVGIGVEFTVHVALGF-LTTQGSRNLRAAHALEHTFAPVTDG-AISTLLGLLMLAGS
::..::..:::. :.. .: ..:. . :: .: . : : :...: :.:.:. .
CCDS43 LVSAVGMSVEFVSHITRSFAISTKPTWLERAKEATISMGSAVFAGVAMTNLPGILVLGLA
1180 1190 1200 1210 1220 1230
1080 1090 1100 1110 1120 1130
pF1KE0 HFDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPP--PEVIQMYKESPEILSPPAPQ
. ..: .:: ..::::::::::.:::.:: .:: : . :.. : ..
CCDS43 KAQLIQIFFFRLNLLITLLGLLHGLVFLPVILSYVGPDVNPALALEQKRAEEAVAAVMVA
1240 1250 1260 1270 1280 1290
1140 1150 1160 1170 1180 1190
pF1KE0 GGGLRWGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPWSPAATSSGNLSSRG
CCDS43 SCPNHPSRVSTADNIYVNHSFEGSIKGAGAISNFLPNNGRQF
1300 1310 1320 1330
>>CCDS5491.1 NPC1L1 gene_id:29881|Hs108|chr7 (1359 aa)
initn: 684 init1: 227 opt: 372 Z-score: 338.9 bits: 74.9 E(32554): 1.5e-12
Smith-Waterman score: 664; 26.4% identity (53.9% similar) in 875 aa overlap (297-1132:554-1312)
270 280 290 300 310 320
pF1KE0 HHSRQAPNVAHELSGGCHGFSHKFMHWQEELLLGGMARDPQGELLRAEALQSTFLLMSPR
: .::. .: :::: ::
CCDS54 YCANAPLTFKDGTALALSCMADYGAPVFPFLAIGGYKGKDYSE---AEALIMTF------
530 540 550 560 570
330 340 350 360 370 380
pF1KE0 QLYEHFRGDYQTHDIGWSEEQASTVLQAWQRRFVQLAQEALPENASQQIHAFSSTTLDDI
.: .. :: . . :: ..:.:::.. . : .. . : . . .:. :
CCDS54 SLNNYPAGDPRLAQAKLWEEAFLEEMRAFQRRMAGMFQVTFMAERSLEDEINRTTAEDLP
580 590 600 610 620 630
390 400 410 420 430 440
pF1KE0 LHAFSEVSAARVVGGYLLMLAYACVTMLRWD--CAQSQGSVGLAGVLLVALAVASGLGLC
. : : . :. .:... : .. :. ..:....::.:: .: :: ...:.
CCDS54 IFATSYI----VI---FLYISLALGSYSSWSRVMVDSKATLGLGGVAVVLGAVMAAMGFF
640 650 660 670 680
450 460 470 480 490 500
pF1KE0 ALLGITFNAATTQVLPFLALGIGVDDVFLLAHAFTEA--LPGTPLQERMGECLQRTGTSV
. ::: . . ::.:::.:..:.:..:... . . :: : . ..:. : :.. :.
CCDS54 SYLGIRSSLVILQVVPFLVLSVGADNIFIFVLEYQRLPRRPGEPREVHIGRALGRVAPSM
690 700 710 720 730 740
510 520 530 540 550 560
pF1KE0 VLTSINNMAAFLMAALVPIPALRAFSLQAAIVVGCTFVAVMLVFPAILSLDLRRRHCQRL
.: :... :...::.:.::.:.:.: ....: :. : .: :.:::: .:.. .::
CCDS54 LLCSLSEAICFFLGALTPMPAVRTFALTSGLAVILDFLLQMSAFVALLSLDSKRQEASRL
750 760 770 780 790 800
570 580 590 600 610 620
pF1KE0 DVLCCFSSPCSAQVIQILPQELGDGTVPVGIAHLTATVQAFTHCEASSQHVVTILPPQAH
:: :: . ::::
CCDS54 DVCCC-----------VKPQEL--------------------------------------
810
630 640 650 660 670 680
pF1KE0 LVPPPSDPLGSELFSPGGSTRDLLGQEEETRQKAACKSLPCARWNLAHFARYQFAPLLLQ
:::.. : ::: ::: .::.::.
CCDS54 --PPPGQGEGL-----------LLG----FFQKA-------------------YAPFLLH
820 830 840
690 700 710 720 730 740
pF1KE0 SHAKAIVLVLFGALLGLSLYGATLVQDGLALTDVVPRGTKEHAFLSAQLRYFSL-YEVAL
....::.:: ::.:.:::. .. :: ..:. . .. ::: . : .
CCDS54 WITRGVVLLLFLALFGVSLYSMCHISVGLDQELALPKDSYLLDYFLFLNRYFEVGAPVYF
850 860 870 880 890 900
750 760 770 780
pF1KE0 VTQGGFDYAH--SQRAL--------FDLHQRFSSLKAVLPPPATQA-P-RTWLHYYRNWL
:: :.... .. :. :.. :... . .: . : : .:. . .::
CCDS54 VTTLGYNFSSEAGMNAICSSAGCNNFSFTQKIQ-YATEFPEQSYLAIPASSWVDDFIDWL
910 920 930 940 950 960
790 800 810 820 830 840
pF1KE0 QGIQAAFDQDWASGRITRHSYRNGSEDGALAYK--LLIQTGDAQEPLD-FSQLTTRKLVD
.. . . :: .. .. .. .. : . : :... .. : . : :
CCDS54 T--PSSCCRLYISGP-NKDKFCPSTVNSLNCLKNCMSITMGSVRPSVEQFHKYLPWFLND
970 980 990 1000 1010
850 860 870 880 890 900
pF1KE0 REGLIPPE--LFYMGLTVWVSSDPLGLAASQANFYPPPPEWLHDKYDTTGENLRIPPAQP
: .. :. : .. .: ..:: : . . . . : : .. .. :: . .
CCDS54 RPNIKCPKGGLAAYSTSVNLTSD--GQVLDTVAILSPRLE--YSGTISAHCNLYLLDST-
1020 1030 1040 1050 1060 1070
910 920 930 940 950
pF1KE0 LEFAQFPFLLRGLQKTADFVEAIEGARAACAEAGQAGVHAYPSGSP-F---------LFW
..: . :... :..::...:: :. : .. :. .: : .:.
CCDS54 ---SRFMAYHKPLKNSQDYTEALRAARELAANI-TADLRKVPGTDPAFEVFPYTITNVFY
1080 1090 1100 1110 1120
960 970 980 990 1000 1010
pF1KE0 EQYLGL--RRCFLLAVCILLVCTFLVCALLLLNPWTAGLI-VLVLAMMTVELFGIMGFLG
:::: . . :.:..: :: :: : ::: .::. .: ..:. :. :.:.. :
CCDS54 EQYLTILPEGLFMLSLC--LVPTFAVSCLLLGLDLRSGLLNLLSIVMILVDTVGFMALWG
1130 1140 1150 1160 1170 1180
1020 1030 1040 1050 1060
pF1KE0 IKLSAIPVVILVASVGIGVEFTVHVALGF-LTTQGSRNLRAAHALEHTFAPVTDG-AIST
:. .:. .. ::..::..:::. :.. .: ..:. . :: .: . : : :...
CCDS54 ISYNAVSLINLVSAVGMSVEFVSHITRSFAISTKPTWLERAKEATISMGSAVFAGVAMTN
1190 1200 1210 1220 1230 1240
1070 1080 1090 1100 1110 1120
pF1KE0 LLGLLMLAGSHFDFIVRYFFAALTVLTLLGLLHGLVLLPVLLSILGPP--PEVIQMYKES
: :.:.:. .. ..: .:: ..::::::::::.:::.:: .:: : . :..
CCDS54 LPGILVLGLAKAQLIQIFFFRLNLLITLLGLLHGLVFLPVILSYVGPDVNPALALEQKRA
1250 1260 1270 1280 1290 1300
1130 1140 1150 1160 1170 1180
pF1KE0 PEILSPPAPQGGGLRWGASSSLPQSFARVTTSMTVAIHPPPLPGAYIHPAPDEPPWSPAA
: ..
CCDS54 EEAVAAVMVASCPNHPSRVSTADNIYVNHSFEGSIKGAGAISNFLPNNGRQF
1310 1320 1330 1340 1350
1203 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 04:06:29 2016 done: Fri Nov 4 04:06:30 2016
Total Scan time: 4.370 Total Display time: 0.420
Function used was FASTA [36.3.4 Apr, 2011]