FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4552, 662 aa
1>>>pF1KE4552 662 - 662 aa - 662 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6612+/-0.0012; mu= 17.6019+/- 0.072
mean_var=72.6621+/-14.547, 0's: 0 Z-trim(102.1): 78 B-trim: 7 in 1/50
Lambda= 0.150460
statistics sampled from 6724 (6803) to 6724 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.561), E-opt: 0.2 (0.209), width: 16
Scan time: 3.580
The best scores are: opt bits E(32554)
CCDS42938.1 ABCG1 gene_id:9619|Hs108|chr21 ( 666) 4367 958.0 0
CCDS13683.1 ABCG1 gene_id:9619|Hs108|chr21 ( 677) 4311 945.8 0
CCDS13681.1 ABCG1 gene_id:9619|Hs108|chr21 ( 663) 4307 944.9 0
CCDS42937.1 ABCG1 gene_id:9619|Hs108|chr21 ( 668) 4307 944.9 0
CCDS8415.1 ABCG4 gene_id:64137|Hs108|chr11 ( 646) 3070 676.4 3.3e-194
CCDS13682.1 ABCG1 gene_id:9619|Hs108|chr21 ( 678) 2485 549.4 5.8e-156
CCDS1814.1 ABCG5 gene_id:64240|Hs108|chr2 ( 651) 762 175.4 2.2e-43
CCDS58910.1 ABCG2 gene_id:9429|Hs108|chr4 ( 611) 620 144.6 3.9e-34
CCDS3628.1 ABCG2 gene_id:9429|Hs108|chr4 ( 655) 620 144.6 4.1e-34
CCDS1815.1 ABCG8 gene_id:64241|Hs108|chr2 ( 673) 508 120.3 8.8e-27
CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 326 81.1 1.9e-14
CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 326 81.1 2.2e-14
CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 305 76.4 3.6e-13
CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 298 74.9 9.5e-13
CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 297 74.8 1.5e-12
CCDS5608.1 ABCB1 gene_id:5243|Hs108|chr7 (1280) 290 73.1 2.7e-12
CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 291 73.4 2.8e-12
CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 291 73.4 2.8e-12
CCDS5607.1 ABCB4 gene_id:5244|Hs108|chr7 (1232) 287 72.5 4.1e-12
CCDS5605.1 ABCB4 gene_id:5244|Hs108|chr7 (1279) 287 72.5 4.2e-12
CCDS5606.1 ABCB4 gene_id:5244|Hs108|chr7 (1286) 287 72.5 4.2e-12
CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 287 72.5 5.2e-12
CCDS9241.1 ABCB9 gene_id:23457|Hs108|chr12 ( 766) 281 71.1 6.7e-12
CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 286 72.4 8.5e-12
CCDS65290.1 ABCB7 gene_id:22|Hs108|chrX ( 712) 278 70.4 9.9e-12
CCDS75994.1 ABCB7 gene_id:22|Hs108|chrX ( 713) 278 70.4 9.9e-12
CCDS65291.1 ABCB7 gene_id:22|Hs108|chrX ( 752) 278 70.4 1e-11
CCDS14428.1 ABCB7 gene_id:22|Hs108|chrX ( 753) 278 70.4 1e-11
CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 281 71.2 1.3e-11
CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 273 69.5 4.2e-11
CCDS64800.1 ABCB8 gene_id:11194|Hs108|chr7 ( 693) 264 67.3 8e-11
>>CCDS42938.1 ABCG1 gene_id:9619|Hs108|chr21 (666 aa)
initn: 4367 init1: 4367 opt: 4367 Z-score: 5121.4 bits: 958.0 E(32554): 0
Smith-Waterman score: 4367; 100.0% identity (100.0% similar) in 662 aa overlap (1-662:5-666)
10 20 30 40 50
pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MACLMAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 AEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 AEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIG
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 IGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYW
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE4 YSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 YSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLG
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE4 LLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILS
550 560 570 580 590 600
600 610 620 630 640 650
pF1KE4 IYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRY
610 620 630 640 650 660
660
pF1KE4 KIRAER
::::::
CCDS42 KIRAER
>>CCDS13683.1 ABCG1 gene_id:9619|Hs108|chr21 (677 aa)
initn: 4311 init1: 4311 opt: 4311 Z-score: 5055.6 bits: 945.8 E(32554): 0
Smith-Waterman score: 4311; 99.7% identity (99.8% similar) in 655 aa overlap (8-662:23-677)
10 20 30 40
pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLL
:. :::::::::::::::::::::::::::::::::::
CCDS13 MRISLPRAPERDGGVSASSLLDTVTNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLL
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE4 NGHLKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NGHLKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFN
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE4 SGELVAIMGPSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SGELVAIMGPSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLL
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE4 PHLTVQEAMMVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PHLTVQEAMMVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIAL
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE4 ELVNNPPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 ELVNNPPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYV
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE4 LSQGQCVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LSQGQCVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMC
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE4 DSDHKRDLGGDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DSDHKRDLGGDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSV
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE4 LTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEM
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE4 GVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALG
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE4 TMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISY
550 560 570 580 590 600
590 600 610 620 630 640
pF1KE4 VRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFIS
610 620 630 640 650 660
650 660
pF1KE4 LRLIAYFVLRYKIRAER
:::::::::::::::::
CCDS13 LRLIAYFVLRYKIRAER
670
>>CCDS13681.1 ABCG1 gene_id:9619|Hs108|chr21 (663 aa)
initn: 4307 init1: 4307 opt: 4307 Z-score: 5051.1 bits: 944.9 E(32554): 0
Smith-Waterman score: 4307; 100.0% identity (100.0% similar) in 652 aa overlap (11-662:12-663)
10 20 30 40 50
pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNLTEA
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MIMRLPQPHGTNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNLTEA
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 QRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 QRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGAG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 KSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAH
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 LKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFFDEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFFDEP
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 TSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCN
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 LVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEV
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 NPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIGIGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 NPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIGIGL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 LIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSL
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE4 KAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLI
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE4 GAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYG
550 560 570 580 590 600
600 610 620 630 640 650
pF1KE4 LDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIR
610 620 630 640 650 660
660
pF1KE4 AER
:::
CCDS13 AER
>>CCDS42937.1 ABCG1 gene_id:9619|Hs108|chr21 (668 aa)
initn: 4307 init1: 4307 opt: 4307 Z-score: 5051.0 bits: 944.9 E(32554): 0
Smith-Waterman score: 4307; 100.0% identity (100.0% similar) in 652 aa overlap (11-662:17-668)
10 20 30 40 50
pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDN
::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MLGTQGWTKQRKPCPQNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 NLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 PSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAM
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 MVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVM
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 FFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 FFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYR
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 GKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLG
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 GDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSH
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 IGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 IGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLN
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE4 YWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 YWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQS
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE4 LGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVI
550 560 570 580 590 600
600 610 620 630 640 650
pF1KE4 LSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVL
610 620 630 640 650 660
660
pF1KE4 RYKIRAER
::::::::
CCDS42 RYKIRAER
>>CCDS8415.1 ABCG4 gene_id:64137|Hs108|chr11 (646 aa)
initn: 3048 init1: 1614 opt: 3070 Z-score: 3600.1 bits: 676.4 E(32554): 3.3e-194
Smith-Waterman score: 3070; 73.6% identity (89.9% similar) in 625 aa overlap (38-662:26-646)
10 20 30 40 50 60
pF1KE4 TAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNLTEAQRFSSLPR
...: .:. :::::.:..::::::: ::.
CCDS84 MAEKALEAVGCGLGPGAVAMAVTLEDGAEPPVLTTHLKKVENHITEAQRFSHLPK
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 RAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGAGKSTLMNIL
:.::.::: .::::: ::: :::.::::::: .:::: ::..:::::::::::.::::
CCDS84 RSAVDIEFVELSYSVREGPCWRKRGYKTLLKCLSGKFCRRELIGIMGPSGAGKSTFMNIL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 AGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAHLKLQEKDE
:::::.:::: .:.:: ::.:: :::.:::::::::::::::: :::::::.:::.::.:
CCDS84 AGYRESGMKGQILVNGRPRELRTFRKMSCYIMQDDMLLPHLTVLEAMMVSANLKLSEKQE
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 GRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSAS
..:.: ::::::::.::..:::. :::::::::::::::::::::::::::::::::::
CCDS84 VKKELVTEILTALGLMSCSHTRTALLSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSAS
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 CFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCNLVPYLRDL
:::::::::.::::::.::::::::::::::.::.::.::::::...: : ::.:::. :
CCDS84 CFQVVSLMKSLAQGGRTIICTIHQPSAKLFEMFDKLYILSQGQCIFKGVVTNLIPYLKGL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 GLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEVNPFLWHRP
::.::::::::::..::::::::: : : :::..:.: .:.. :: :
CCDS84 GLHCPTYHNPADFIIEVASGEYGDLNPMLFRAVQNGLCAMAEKKSSPEKNEVPAPCPPCP
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 SEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLG
: : .:. :.:..: :::::::::::::::.::.::::::. ::. ::.:::::::
CCDS84 PEVD--PIES-HTFATSTLTQFCILFKRTFLSILRDTVLTHLRFMSHVVIGVLIGLLYLH
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 IGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKT
::..:.::..:.: ::::::::::::::::::::::::.::.::::::::::::::::::
CCDS84 IGDDASKVFNNTGCLFFSMLFLMFAALMPTVLTFPLEMAVFMREHLNYWYSLKAYYLAKT
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE4 MADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLIGAASTSLQ
:::::::.. ::.:::::::::.::... ::.::.::.: :.::::::::::::::.:::
CCDS84 MADVPFQVVCPVVYCSIVYWMTGQPAETSRFLLFSALATATALVAQSLGLLIGAASNSLQ
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE4 VATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYGLDREDLHC
::::::::::::::::::::::: :::::::: ::.::::::::::::.:::..: :: :
CCDS84 VATFVGPVTAIPVLLFSGFFVSFKTIPTYLQWSSYLSYVRYGFEGVILTIYGMERGDLTC
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE4 DIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIRAER
..: : :.. ..::: ::::.::::.::.::::::..:::.::.::::....::
CCDS84 -LEERCPFREPQSILRALDVEDAKLYMDFLVLGIFFLALRLLAYLVLRYRVKSER
600 610 620 630 640
>>CCDS13682.1 ABCG1 gene_id:9619|Hs108|chr21 (678 aa)
initn: 2465 init1: 2465 opt: 2485 Z-score: 2913.5 bits: 549.4 E(32554): 5.8e-156
Smith-Waterman score: 4333; 98.2% identity (98.2% similar) in 674 aa overlap (1-662:5-678)
10 20 30 40 50
pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MACLMAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD
310 320 330 340 350 360
360 370 380 390 400
pF1KE4 AEVNPFLWHRPSEE------------DSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDS
:::::::::::::: ::::::::::::::::::::::::::::::::::
CCDS13 AEVNPFLWHRPSEEVKQTKRLKGLRKDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDS
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE4 VLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 VLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLE
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE4 MGVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MGVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAAL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE4 GTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 GTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYIS
550 560 570 580 590 600
590 600 610 620 630 640
pF1KE4 YVRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 YVRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFI
610 620 630 640 650 660
650 660
pF1KE4 SLRLIAYFVLRYKIRAER
::::::::::::::::::
CCDS13 SLRLIAYFVLRYKIRAER
670
>>CCDS1814.1 ABCG5 gene_id:64240|Hs108|chr2 (651 aa)
initn: 608 init1: 374 opt: 762 Z-score: 892.5 bits: 175.4 E(32554): 2.2e-43
Smith-Waterman score: 787; 26.8% identity (60.7% similar) in 608 aa overlap (79-659:44-645)
50 60 70 80 90 100
pF1KE4 LKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVPEG--PWW-----RKKGYKTLLKGIS
:::: . ::: :.. . .:: .:
CCDS18 GLQVNRGSQSSLEGAPATAPEPHSLGILHASYSVSHRVRPWWDITSCRQQWTRQILKDVS
20 30 40 50 60 70
110 120 130 140 150
pF1KE4 GKFNSGELVAIMGPSGAGKSTLMNILAGY--RETGMKGAVLINGLPRDLRCFRKVSC--Y
.::... :.: ::.::.::.. ..: : . : : .:: : :: . .: :
CCDS18 LYVESGQIMCILGSSGSGKTTLLDAMSGRLGRAGTFLGEVYVNG--RALRREQFQDCFSY
80 90 100 110 120 130
160 170 180 190 200 210
pF1KE4 IMQDDMLLPHLTVQEAMMVSAHLKLQEKDEGR-REMVKEILTALGLLSCA-----NTRTG
..:.: :: :::.:.. .: : ... . : .. :. ... :.: : : :
CCDS18 VLQSDTLLSSLTVRETLHYTALLAIRRGNPGSFQKKVEAVMAELSLSHVADRLIGNYSLG
140 150 160 170 180 190
220 230 240 250 260 270
pF1KE4 SLSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQ
..: :.:.:..:: .:...: ::.:::::.::: . :.: :. ::. .: .. ::::
CCDS18 GISTGERRRVSIAAQLLQDPKVMLFDEPTTGLDCMTANQIVVLLVELARRNRIVVLTIHQ
200 210 220 230 240 250
280 290 300 310 320 330
pF1KE4 PSAKLFELFDQLYVLSQGQCVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGD
: ..::.:::.. .:: :. .. : ... .. : : :: . :: :: :...: . .
CCDS18 PRSELFQLFDKIAILSFGELIFCGTPAEMLDFFNDCGYPCPEHSNPFDFYMDLTSVDTQS
260 270 280 290 300 310
340 350 360 370 380 390
pF1KE4 QNSRLVRAVREGMCDSDHKRDLGGDAEVNPFLWHRPSEEDSSSMEGCHSF-SASCLTQFC
.. .. . : : .: .:.. .. . .: .. . : .. : . ....
CCDS18 KEREIETSKRVQMIESAYKKSAICHKTLKNI--ERMKHLKTLPMVPFKTKDSPGVFSKLG
320 330 340 350 360
400 410 420 430 440
pF1KE4 ILFKRTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLGIGNEAKK--VLSNSGFLFFSMLF
.:..:. ...:... . :. ... .::.. .. : . ... : . . :.:. .
CCDS18 VLLRRVTRNLVRNKLAVITRLLQNLIMGLFLLFFVLRVRSNVLKGAIQDRVGLLYQFVGA
370 380 390 400 410 420
450 460 470 480 490 500
pF1KE4 LMFAALMPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWM
..... .: ::. .: .: . :. ..:: .. .::... . . :. ::
CCDS18 TPYTGMLNAVNLFPVLRAVSDQESQDGLYQKWQMMLAYALHVLPFSVVATMIFSSVCYWT
430 440 450 460 470 480
510 520 530 540 550 560
pF1KE4 TSQPSDAVRFVLFAALGTMTSLVAQSLGL-LIGAASTSLQVATFVGPVTAIPVLLFSGFF
. ...:: :.: :... : : :.: ... : . :. .. ::. :::.
CCDS18 LGLHPEVARFGYFSAALLAPHLIGEFLTLVLLGIVQNPNIVNSVVALLSIAGVLVGSGFL
490 500 510 520 530 540
570 580 590 600 610 620
pF1KE4 VSFDTIPTYLQWMSYISYVRYGFEGVILS-IYGLD----REDLHCDIDETCHF-QKSEAI
... .: .. .::... .: : .... .:::. .. . : : : . :
CCDS18 RNIQEMPIPFKIISYFTFQKYCSEILVVNEFYGLNFTCGSSNVSVTTNPMCAFTQGIQFI
550 560 570 580 590 600
630 640 650 660
pF1KE4 LRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIRAER
. .... ..:..: :. .: ... : .:::
CCDS18 EKTCPGATSRFTMNFLILYSFIPALVILGIVV--FKIRDHLISR
610 620 630 640 650
>>CCDS58910.1 ABCG2 gene_id:9429|Hs108|chr4 (611 aa)
initn: 592 init1: 369 opt: 620 Z-score: 726.3 bits: 144.6 E(32554): 3.9e-34
Smith-Waterman score: 812; 30.2% identity (67.4% similar) in 500 aa overlap (89-562:56-550)
60 70 80 90 100 110
pF1KE4 AQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGA
:: : .:..:.: .. : : ::.::.:.
CCDS58 NDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVEKEILSNINGIMKPG-LNAILGPTGG
30 40 50 60 70 80
120 130 140 150 160 170
pF1KE4 GKSTLMNILAGYRE-TGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVS
:::.:...::. .. .:..: ::::: :: :. : :..:::... :::.: .. :
CCDS58 GKSSLLDVLAARKDPSGLSGDVLINGAPRPAN-FKCNSGYVVQDDVVMGTLTVRENLQFS
90 100 110 120 130 140
180 190 200 210 220 230
pF1KE4 AHLKLQEK--DEGRREMVKEILTALGLLSCANTRTGS-----LSGGQRKRLAIALELVNN
: :.: .. . : ..... ::: . :....:. .:::.::: .:..::...
CCDS58 AALRLATTMTNHEKNERINRVIQELGLDKVADSKVGTQFIRGVSGGERKRTSIGMELITD
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE4 PPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQ
: ..:.::::.::::.. :. :.: ... ::.:: .:::: ..:.:::.: .:..:.
CCDS58 PSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTIIFSIHQPRYSIFKLFDSLTLLASGR
210 220 230 240 250 260
300 310 320 330 340
pF1KE4 CVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYG------DQNSRLVRAVREGM
...: . . . :... : .: .:.::::: ... .:. ... . .. .. .
CCDS58 LMFHGPAQEALGYFESAGYHCEAYNNPADFFLDIINGDSTAVALNREEDFKATEIIEPSK
270 280 290 300 310 320
350 360 370 380 390
pF1KE4 CDSDHKRDLGGDAEVNPFLWHRPSEE--DSSSMEGCHSFSA----SCLTQFCILF----K
:. . :. . :: .... . : . :. : ..... : :.:: . :
CCDS58 QDKPLIEKLA-EIYVNSSFYKETKAELHQLSGGEKKKKITVFKEISYTTSFCHQLRWVSK
330 340 350 360 370 380
400 410 420 430 440 450
pF1KE4 RTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAAL
:.: ... . . .: . .::.:: .:.:. :.. . . .: ::: :...
CCDS58 RSFKNLLGNPQASIAQIIVTVVLGLVIGAIYFGLKNDSTGIQNRAGVLFFLTTNQCFSSV
390 400 410 420 430 440
460 470 480 490 500 510
pF1KE4 MPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKTMADV-PFQIMFPVAYCSIVYWMTS-QP
.: : .: .:..:... .: ...:.:.: ..:. :.... . . :::.: . .:
CCDS58 -SAVELFVVEKKLFIHEYISGYYRVSSYFLGKLLSDLLPMRMLPSIIFTCIVYFMLGLKP
450 460 470 480 490 500
520 530 540 550 560 570
pF1KE4 SDAVRFVLFAALGTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDT
. . ::.. .: :.. :.:..: :.:... ..:::.. . . ...
CCDS58 KADAFFVMMFTL-MMVAYSASSMALAIAAGQSVVSVATLLMTICFVFMMVCWSISQPLHL
510 520 530 540 550 560
580 590 600 610 620 630
pF1KE4 IPTYLQWMSYISYVRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKL
CCDS58 GCHGFSTSAFHDMDLRLCSIMNFWDKTSAQDSMQQETILVTMQHVLAKNIW
570 580 590 600 610
>>CCDS3628.1 ABCG2 gene_id:9429|Hs108|chr4 (655 aa)
initn: 740 init1: 369 opt: 620 Z-score: 725.8 bits: 144.6 E(32554): 4.1e-34
Smith-Waterman score: 927; 29.3% identity (66.5% similar) in 600 aa overlap (89-656:56-650)
60 70 80 90 100 110
pF1KE4 AQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGA
:: : .:..:.: .. : : ::.::.:.
CCDS36 NDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVEKEILSNINGIMKPG-LNAILGPTGG
30 40 50 60 70 80
120 130 140 150 160 170
pF1KE4 GKSTLMNILAGYRE-TGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVS
:::.:...::. .. .:..: ::::: :: :. : :..:::... :::.: .. :
CCDS36 GKSSLLDVLAARKDPSGLSGDVLINGAPRPAN-FKCNSGYVVQDDVVMGTLTVRENLQFS
90 100 110 120 130 140
180 190 200 210 220 230
pF1KE4 AHLKLQEK--DEGRREMVKEILTALGLLSCANTRTGS-----LSGGQRKRLAIALELVNN
: :.: .. . : ..... ::: . :....:. .:::.::: .:..::...
CCDS36 AALRLATTMTNHEKNERINRVIQELGLDKVADSKVGTQFIRGVSGGERKRTSIGMELITD
150 160 170 180 190 200
240 250 260 270 280 290
pF1KE4 PPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQ
: ..:.::::.::::.. :. :.: ... ::.:: .:::: ..:.:::.: .:..:.
CCDS36 PSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTIIFSIHQPRYSIFKLFDSLTLLASGR
210 220 230 240 250 260
300 310 320 330 340
pF1KE4 CVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYG------DQNSRLVRAVREGM
...: . . . :... : .: .:.::::: ... .:. ... . .. .. .
CCDS36 LMFHGPAQEALGYFESAGYHCEAYNNPADFFLDIINGDSTAVALNREEDFKATEIIEPSK
270 280 290 300 310 320
350 360 370 380 390
pF1KE4 CDSDHKRDLGGDAEVNPFLWHRPSEE--DSSSMEGCHSFSA----SCLTQFCILF----K
:. . :. . :: .... . : . :. : ..... : :.:: . :
CCDS36 QDKPLIEKLA-EIYVNSSFYKETKAELHQLSGGEKKKKITVFKEISYTTSFCHQLRWVSK
330 340 350 360 370 380
400 410 420 430 440 450
pF1KE4 RTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAAL
:.: ... . . .: . .::.:: .:.:. :.. . . .: ::: :...
CCDS36 RSFKNLLGNPQASIAQIIVTVVLGLVIGAIYFGLKNDSTGIQNRAGVLFFLTTNQCFSSV
390 400 410 420 430 440
460 470 480 490 500 510
pF1KE4 MPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKTMADV-PFQIMFPVAYCSIVYWMTS-QP
.: : .: .:..:... .: ...:.:.: ..:. :.... . . :::.: . .:
CCDS36 -SAVELFVVEKKLFIHEYISGYYRVSSYFLGKLLSDLLPMRMLPSIIFTCIVYFMLGLKP
450 460 470 480 490 500
520 530 540 550 560 570
pF1KE4 SDAVRFVLFAALGTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDT
. . ::.. .: :.. :.:..: :.:... ..:::.. . . ...:::..:.. :
CCDS36 KADAFFVMMFTL-MMVAYSASSMALAIAAGQSVVSVATLLMTICFVFMMIFSGLLVNLTT
510 520 530 540 550 560
580 590 600 610 620
pF1KE4 IPTYLQWMSYISYVRYGFEGVILSIY-GLDR-EDLHCDIDETCHFQKS---EAILRE-LD
: ..:.:..:.: :::: .. . . : . :. .. :.. : .... .:
CCDS36 IASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGNNPCNYATCTGEEYLVKQGID
570 580 590 600 610 620
630 640 650 660
pF1KE4 VENAKLYLDFIVLGIFFISLRLIAYFVLRYKIRAER
. :. . ..:. ... . :::. : .
CCDS36 LSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS
630 640 650
>>CCDS1815.1 ABCG8 gene_id:64241|Hs108|chr2 (673 aa)
initn: 726 init1: 347 opt: 508 Z-score: 594.3 bits: 120.3 E(32554): 8.8e-27
Smith-Waterman score: 803; 26.1% identity (60.6% similar) in 624 aa overlap (73-649:47-665)
50 60 70 80
pF1KE4 DLLNGHLKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVP---EGPW----------WR
.: :::.:.: . :: :
CCDS18 PQDTSGLQDRLFSSESDNSLYFTYSGQPNTLEVRDLNYQVDLASQVPWFEQLAQFKMPWT
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE4 KKGYKTL----LKGISGKFNSGELVAIMGPSGAGKSTLMNILAGYRETGM--KGAVLING
. . .. ....: : ::...::.: :: :...:.....: . : .: . :::
CCDS18 SPSCQNSCELGIQNLSFKVRSGQMLAIIGSSGCGRASLLDVITGRGHGGKIKSGQIWING
80 90 100 110 120 130
150 160 170 180 190 200
pF1KE4 LPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAHLKLQE--KDEGRREMVKEILTALG
: . . :: .. : ..:::.:::.:.. :...: . .. : . :..... :
CCDS18 QPSSPQLVRKCVAHVRQHNQLLPNLTVRETLAFIAQMRLPRTFSQAQRDKRVEDVIAELR
140 150 160 170 180 190
210 220 230 240 250
pF1KE4 LLSCANTRTGS-----LSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSASCFQVVSLMK
: .::.::.:. ::::.:.:..:...:. :: ....::::::::: . ..:. ..
CCDS18 LRQCADTRVGNMYVRGLSGGERRRVSIGVQLLWNPGILILDEPTSGLDSFTAHNLVKTLS
200 210 220 230 240 250
260 270 280 290 300 310
pF1KE4 GLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCNLVPYLRDLGLNCPTYHN
::.:.: .. ..::: . .:.::: . ....: .: : . ..: :. .: :: : :
CCDS18 RLAKGNRLVLISLHQPRSDIFRLFDLVLLMTSGTPIYLGAAQHMVQYFTAIGYPCPRYSN
260 270 280 290 300 310
320 330 340 350 360 370
pF1KE4 PADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEVNPFLWHRPS---EEDSS
:::: ....: . .....: :.:: .: : ... :::. . .::.
CCDS18 PADFYVDLTSIDRRSREQEL--ATREKA-QSLAALFLEKVRDLDDFLWKAETKDLDEDTC
320 330 340 350 360 370
380 390 400 410 420
pF1KE4 SMEGCHSFSASCLT----------QFCILFKRTFLSIMRDSVLTHLRITSHIGIGLLIGL
. ....:: :: :..: . . .:: .. . ... ::.
CCDS18 VESSVTPLDTNCLPSPTKMPGAVQQFTTLIRRQISNDFRDLPTLLIHGAEACLMSMTIGF
380 390 400 410 420 430
430 440 450 460 470 480
pF1KE4 LYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSLKAYY
::.: :. . ......::. .. : ... .. : ... : . :. :.
CCDS18 LYFGHGSIQLSFMDTAALLFMIGALIPFNVILDVISKCYSERAMLYYELEDGLYTTGPYF
440 450 460 470 480 490
490 500 510 520 530 540
pF1KE4 LAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLIGAAS
.:: ....: . . . : .::... :.: : .. . . ..: .:
CCDS18 FAKILGELPEHCAYIIIYGMPTYWLANLRPGLQPFLLHFLLVWLVVFCCRIMALAAAALL
500 510 520 530 540 550
550 560 570 580 590 600
pF1KE4 TSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYGLDRE
....:.: . . : .::....... : :.: .:..:. ::: ...: ..:.
CCDS18 PTFHMASFFSNALYNSFYLAGGFMINLSSLWTVPAWISKVSFLRWCFEG-LMKIQ-FSRR
560 570 580 590 600 610
610 620 630 640 650
pF1KE4 DLHCDIDETCHFQKSEAILRELDVENAKLY-LDFIVLGI-------FFISLRLIAYFVLR
. . . ... :: ..... :: . .::.:. ...:::.:
CCDS18 TYKMPLGNLTIAVSGDKILSVMELDSYPLYAIYLIVIGLSGGFMVLYYVSLRFIKQKPSQ
620 630 640 650 660 670
660
pF1KE4 YKIRAER
CCDS18 DW
662 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 00:01:05 2016 done: Sun Nov 6 00:01:06 2016
Total Scan time: 3.580 Total Display time: 0.200
Function used was FASTA [36.3.4 Apr, 2011]