FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4552, 662 aa 1>>>pF1KE4552 662 - 662 aa - 662 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6612+/-0.0012; mu= 17.6019+/- 0.072 mean_var=72.6621+/-14.547, 0's: 0 Z-trim(102.1): 78 B-trim: 7 in 1/50 Lambda= 0.150460 statistics sampled from 6724 (6803) to 6724 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.561), E-opt: 0.2 (0.209), width: 16 Scan time: 3.580 The best scores are: opt bits E(32554) CCDS42938.1 ABCG1 gene_id:9619|Hs108|chr21 ( 666) 4367 958.0 0 CCDS13683.1 ABCG1 gene_id:9619|Hs108|chr21 ( 677) 4311 945.8 0 CCDS13681.1 ABCG1 gene_id:9619|Hs108|chr21 ( 663) 4307 944.9 0 CCDS42937.1 ABCG1 gene_id:9619|Hs108|chr21 ( 668) 4307 944.9 0 CCDS8415.1 ABCG4 gene_id:64137|Hs108|chr11 ( 646) 3070 676.4 3.3e-194 CCDS13682.1 ABCG1 gene_id:9619|Hs108|chr21 ( 678) 2485 549.4 5.8e-156 CCDS1814.1 ABCG5 gene_id:64240|Hs108|chr2 ( 651) 762 175.4 2.2e-43 CCDS58910.1 ABCG2 gene_id:9429|Hs108|chr4 ( 611) 620 144.6 3.9e-34 CCDS3628.1 ABCG2 gene_id:9429|Hs108|chr4 ( 655) 620 144.6 4.1e-34 CCDS1815.1 ABCG8 gene_id:64241|Hs108|chr2 ( 673) 508 120.3 8.8e-27 CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 326 81.1 1.9e-14 CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 326 81.1 2.2e-14 CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 305 76.4 3.6e-13 CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 298 74.9 9.5e-13 CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 297 74.8 1.5e-12 CCDS5608.1 ABCB1 gene_id:5243|Hs108|chr7 (1280) 290 73.1 2.7e-12 CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 291 73.4 2.8e-12 CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 291 73.4 2.8e-12 CCDS5607.1 ABCB4 gene_id:5244|Hs108|chr7 (1232) 287 72.5 4.1e-12 CCDS5605.1 ABCB4 gene_id:5244|Hs108|chr7 (1279) 287 72.5 4.2e-12 CCDS5606.1 ABCB4 gene_id:5244|Hs108|chr7 (1286) 287 72.5 4.2e-12 CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 287 72.5 5.2e-12 CCDS9241.1 ABCB9 gene_id:23457|Hs108|chr12 ( 766) 281 71.1 6.7e-12 CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 286 72.4 8.5e-12 CCDS65290.1 ABCB7 gene_id:22|Hs108|chrX ( 712) 278 70.4 9.9e-12 CCDS75994.1 ABCB7 gene_id:22|Hs108|chrX ( 713) 278 70.4 9.9e-12 CCDS65291.1 ABCB7 gene_id:22|Hs108|chrX ( 752) 278 70.4 1e-11 CCDS14428.1 ABCB7 gene_id:22|Hs108|chrX ( 753) 278 70.4 1e-11 CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 281 71.2 1.3e-11 CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 273 69.5 4.2e-11 CCDS64800.1 ABCB8 gene_id:11194|Hs108|chr7 ( 693) 264 67.3 8e-11 >>CCDS42938.1 ABCG1 gene_id:9619|Hs108|chr21 (666 aa) initn: 4367 init1: 4367 opt: 4367 Z-score: 5121.4 bits: 958.0 E(32554): 0 Smith-Waterman score: 4367; 100.0% identity (100.0% similar) in 662 aa overlap (1-662:5-666) 10 20 30 40 50 pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MACLMAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 AEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 AEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIG 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 IGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 IGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYW 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE4 YSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 YSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLG 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE4 LLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILS 550 560 570 580 590 600 600 610 620 630 640 650 pF1KE4 IYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 IYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRY 610 620 630 640 650 660 660 pF1KE4 KIRAER :::::: CCDS42 KIRAER >>CCDS13683.1 ABCG1 gene_id:9619|Hs108|chr21 (677 aa) initn: 4311 init1: 4311 opt: 4311 Z-score: 5055.6 bits: 945.8 E(32554): 0 Smith-Waterman score: 4311; 99.7% identity (99.8% similar) in 655 aa overlap (8-662:23-677) 10 20 30 40 pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLL :. ::::::::::::::::::::::::::::::::::: CCDS13 MRISLPRAPERDGGVSASSLLDTVTNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLL 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE4 NGHLKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NGHLKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFN 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE4 SGELVAIMGPSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SGELVAIMGPSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLL 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE4 PHLTVQEAMMVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PHLTVQEAMMVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIAL 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE4 ELVNNPPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ELVNNPPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYV 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE4 LSQGQCVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LSQGQCVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMC 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE4 DSDHKRDLGGDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DSDHKRDLGGDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSV 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE4 LTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEM 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE4 GVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALG 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE4 TMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISY 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE4 VRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFIS 610 620 630 640 650 660 650 660 pF1KE4 LRLIAYFVLRYKIRAER ::::::::::::::::: CCDS13 LRLIAYFVLRYKIRAER 670 >>CCDS13681.1 ABCG1 gene_id:9619|Hs108|chr21 (663 aa) initn: 4307 init1: 4307 opt: 4307 Z-score: 5051.1 bits: 944.9 E(32554): 0 Smith-Waterman score: 4307; 100.0% identity (100.0% similar) in 652 aa overlap (11-662:12-663) 10 20 30 40 50 pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNLTEA ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MIMRLPQPHGTNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNLTEA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 QRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGAG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 KSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAH 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 LKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFFDEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFFDEP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 TSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCN 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 LVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEV 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 NPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIGIGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 NPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIGIGL 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 LIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSL 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE4 KAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLI 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE4 GAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYG 550 560 570 580 590 600 600 610 620 630 640 650 pF1KE4 LDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIR 610 620 630 640 650 660 660 pF1KE4 AER ::: CCDS13 AER >>CCDS42937.1 ABCG1 gene_id:9619|Hs108|chr21 (668 aa) initn: 4307 init1: 4307 opt: 4307 Z-score: 5051.0 bits: 944.9 E(32554): 0 Smith-Waterman score: 4307; 100.0% identity (100.0% similar) in 652 aa overlap (11-662:17-668) 10 20 30 40 50 pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDN :::::::::::::::::::::::::::::::::::::::::::: CCDS42 MLGTQGWTKQRKPCPQNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 NLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 NLTEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 PSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 PSGAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAM 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 MVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 MVSAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVM 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 FFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 FFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYR 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 GKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 GDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 GDAEVNPFLWHRPSEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSH 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 IGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 IGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLN 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE4 YWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 YWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQS 490 500 510 520 530 540 540 550 560 570 580 590 pF1KE4 LGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVI 550 560 570 580 590 600 600 610 620 630 640 650 pF1KE4 LSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS42 LSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVL 610 620 630 640 650 660 660 pF1KE4 RYKIRAER :::::::: CCDS42 RYKIRAER >>CCDS8415.1 ABCG4 gene_id:64137|Hs108|chr11 (646 aa) initn: 3048 init1: 1614 opt: 3070 Z-score: 3600.1 bits: 676.4 E(32554): 3.3e-194 Smith-Waterman score: 3070; 73.6% identity (89.9% similar) in 625 aa overlap (38-662:26-646) 10 20 30 40 50 60 pF1KE4 TAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNLTEAQRFSSLPR ...: .:. :::::.:..::::::: ::. CCDS84 MAEKALEAVGCGLGPGAVAMAVTLEDGAEPPVLTTHLKKVENHITEAQRFSHLPK 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 RAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGAGKSTLMNIL :.::.::: .::::: ::: :::.::::::: .:::: ::..:::::::::::.:::: CCDS84 RSAVDIEFVELSYSVREGPCWRKRGYKTLLKCLSGKFCRRELIGIMGPSGAGKSTFMNIL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 AGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAHLKLQEKDE :::::.:::: .:.:: ::.:: :::.:::::::::::::::: :::::::.:::.::.: CCDS84 AGYRESGMKGQILVNGRPRELRTFRKMSCYIMQDDMLLPHLTVLEAMMVSANLKLSEKQE 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 GRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSAS ..:.: ::::::::.::..:::. ::::::::::::::::::::::::::::::::::: CCDS84 VKKELVTEILTALGLMSCSHTRTALLSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSAS 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 CFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCNLVPYLRDL :::::::::.::::::.::::::::::::::.::.::.::::::...: : ::.:::. : CCDS84 CFQVVSLMKSLAQGGRTIICTIHQPSAKLFEMFDKLYILSQGQCIFKGVVTNLIPYLKGL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 GLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEVNPFLWHRP ::.::::::::::..::::::::: : : :::..:.: .:.. :: : CCDS84 GLHCPTYHNPADFIIEVASGEYGDLNPMLFRAVQNGLCAMAEKKSSPEKNEVPAPCPPCP 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 SEEDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLG : : .:. :.:..: :::::::::::::::.::.::::::. ::. ::.::::::: CCDS84 PEVD--PIES-HTFATSTLTQFCILFKRTFLSILRDTVLTHLRFMSHVVIGVLIGLLYLH 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 IGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKT ::..:.::..:.: ::::::::::::::::::::::::.::.:::::::::::::::::: CCDS84 IGDDASKVFNNTGCLFFSMLFLMFAALMPTVLTFPLEMAVFMREHLNYWYSLKAYYLAKT 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE4 MADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLIGAASTSLQ :::::::.. ::.:::::::::.::... ::.::.::.: :.::::::::::::::.::: CCDS84 MADVPFQVVCPVVYCSIVYWMTGQPAETSRFLLFSALATATALVAQSLGLLIGAASNSLQ 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE4 VATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYGLDREDLHC ::::::::::::::::::::::: :::::::: ::.::::::::::::.:::..: :: : CCDS84 VATFVGPVTAIPVLLFSGFFVSFKTIPTYLQWSSYLSYVRYGFEGVILTIYGMERGDLTC 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE4 DIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIRAER ..: : :.. ..::: ::::.::::.::.::::::..:::.::.::::....:: CCDS84 -LEERCPFREPQSILRALDVEDAKLYMDFLVLGIFFLALRLLAYLVLRYRVKSER 600 610 620 630 640 >>CCDS13682.1 ABCG1 gene_id:9619|Hs108|chr21 (678 aa) initn: 2465 init1: 2465 opt: 2485 Z-score: 2913.5 bits: 549.4 E(32554): 5.8e-156 Smith-Waterman score: 4333; 98.2% identity (98.2% similar) in 674 aa overlap (1-662:5-678) 10 20 30 40 50 pF1KE4 MAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MACLMAAFSVGTAMNASSYSAEMTEPKSVCVSVDEVVSSNMEATETDLLNGHLKKVDNNL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TEAQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GAGKSTLMNILAGYRETGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SAHLKLQEKDEGRREMVKEILTALGLLSCANTRTGSLSGGQRKRLAIALELVNNPPVMFF 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGK 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGD 310 320 330 340 350 360 360 370 380 390 400 pF1KE4 AEVNPFLWHRPSEE------------DSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDS :::::::::::::: :::::::::::::::::::::::::::::::::: CCDS13 AEVNPFLWHRPSEEVKQTKRLKGLRKDSSSMEGCHSFSASCLTQFCILFKRTFLSIMRDS 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE4 VLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLE 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE4 MGVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MGVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAAL 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE4 GTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYIS 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE4 YVRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YVRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKLYLDFIVLGIFFI 610 620 630 640 650 660 650 660 pF1KE4 SLRLIAYFVLRYKIRAER :::::::::::::::::: CCDS13 SLRLIAYFVLRYKIRAER 670 >>CCDS1814.1 ABCG5 gene_id:64240|Hs108|chr2 (651 aa) initn: 608 init1: 374 opt: 762 Z-score: 892.5 bits: 175.4 E(32554): 2.2e-43 Smith-Waterman score: 787; 26.8% identity (60.7% similar) in 608 aa overlap (79-659:44-645) 50 60 70 80 90 100 pF1KE4 LKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVPEG--PWW-----RKKGYKTLLKGIS :::: . ::: :.. . .:: .: CCDS18 GLQVNRGSQSSLEGAPATAPEPHSLGILHASYSVSHRVRPWWDITSCRQQWTRQILKDVS 20 30 40 50 60 70 110 120 130 140 150 pF1KE4 GKFNSGELVAIMGPSGAGKSTLMNILAGY--RETGMKGAVLINGLPRDLRCFRKVSC--Y .::... :.: ::.::.::.. ..: : . : : .:: : :: . .: : CCDS18 LYVESGQIMCILGSSGSGKTTLLDAMSGRLGRAGTFLGEVYVNG--RALRREQFQDCFSY 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE4 IMQDDMLLPHLTVQEAMMVSAHLKLQEKDEGR-REMVKEILTALGLLSCA-----NTRTG ..:.: :: :::.:.. .: : ... . : .. :. ... :.: : : : CCDS18 VLQSDTLLSSLTVRETLHYTALLAIRRGNPGSFQKKVEAVMAELSLSHVADRLIGNYSLG 140 150 160 170 180 190 220 230 240 250 260 270 pF1KE4 SLSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQ ..: :.:.:..:: .:...: ::.:::::.::: . :.: :. ::. .: .. :::: CCDS18 GISTGERRRVSIAAQLLQDPKVMLFDEPTTGLDCMTANQIVVLLVELARRNRIVVLTIHQ 200 210 220 230 240 250 280 290 300 310 320 330 pF1KE4 PSAKLFELFDQLYVLSQGQCVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYGD : ..::.:::.. .:: :. .. : ... .. : : :: . :: :: :...: . . CCDS18 PRSELFQLFDKIAILSFGELIFCGTPAEMLDFFNDCGYPCPEHSNPFDFYMDLTSVDTQS 260 270 280 290 300 310 340 350 360 370 380 390 pF1KE4 QNSRLVRAVREGMCDSDHKRDLGGDAEVNPFLWHRPSEEDSSSMEGCHSF-SASCLTQFC .. .. . : : .: .:.. .. . .: .. . : .. : . .... CCDS18 KEREIETSKRVQMIESAYKKSAICHKTLKNI--ERMKHLKTLPMVPFKTKDSPGVFSKLG 320 330 340 350 360 400 410 420 430 440 pF1KE4 ILFKRTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLGIGNEAKK--VLSNSGFLFFSMLF .:..:. ...:... . :. ... .::.. .. : . ... : . . :.:. . CCDS18 VLLRRVTRNLVRNKLAVITRLLQNLIMGLFLLFFVLRVRSNVLKGAIQDRVGLLYQFVGA 370 380 390 400 410 420 450 460 470 480 490 500 pF1KE4 LMFAALMPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKTMADVPFQIMFPVAYCSIVYWM ..... .: ::. .: .: . :. ..:: .. .::... . . :. :: CCDS18 TPYTGMLNAVNLFPVLRAVSDQESQDGLYQKWQMMLAYALHVLPFSVVATMIFSSVCYWT 430 440 450 460 470 480 510 520 530 540 550 560 pF1KE4 TSQPSDAVRFVLFAALGTMTSLVAQSLGL-LIGAASTSLQVATFVGPVTAIPVLLFSGFF . ...:: :.: :... : : :.: ... : . :. .. ::. :::. CCDS18 LGLHPEVARFGYFSAALLAPHLIGEFLTLVLLGIVQNPNIVNSVVALLSIAGVLVGSGFL 490 500 510 520 530 540 570 580 590 600 610 620 pF1KE4 VSFDTIPTYLQWMSYISYVRYGFEGVILS-IYGLD----REDLHCDIDETCHF-QKSEAI ... .: .. .::... .: : .... .:::. .. . : : : . : CCDS18 RNIQEMPIPFKIISYFTFQKYCSEILVVNEFYGLNFTCGSSNVSVTTNPMCAFTQGIQFI 550 560 570 580 590 600 630 640 650 660 pF1KE4 LRELDVENAKLYLDFIVLGIFFISLRLIAYFVLRYKIRAER . .... ..:..: :. .: ... : .::: CCDS18 EKTCPGATSRFTMNFLILYSFIPALVILGIVV--FKIRDHLISR 610 620 630 640 650 >>CCDS58910.1 ABCG2 gene_id:9429|Hs108|chr4 (611 aa) initn: 592 init1: 369 opt: 620 Z-score: 726.3 bits: 144.6 E(32554): 3.9e-34 Smith-Waterman score: 812; 30.2% identity (67.4% similar) in 500 aa overlap (89-562:56-550) 60 70 80 90 100 110 pF1KE4 AQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGA :: : .:..:.: .. : : ::.::.:. CCDS58 NDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVEKEILSNINGIMKPG-LNAILGPTGG 30 40 50 60 70 80 120 130 140 150 160 170 pF1KE4 GKSTLMNILAGYRE-TGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVS :::.:...::. .. .:..: ::::: :: :. : :..:::... :::.: .. : CCDS58 GKSSLLDVLAARKDPSGLSGDVLINGAPRPAN-FKCNSGYVVQDDVVMGTLTVRENLQFS 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE4 AHLKLQEK--DEGRREMVKEILTALGLLSCANTRTGS-----LSGGQRKRLAIALELVNN : :.: .. . : ..... ::: . :....:. .:::.::: .:..::... CCDS58 AALRLATTMTNHEKNERINRVIQELGLDKVADSKVGTQFIRGVSGGERKRTSIGMELITD 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE4 PPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQ : ..:.::::.::::.. :. :.: ... ::.:: .:::: ..:.:::.: .:..:. CCDS58 PSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTIIFSIHQPRYSIFKLFDSLTLLASGR 210 220 230 240 250 260 300 310 320 330 340 pF1KE4 CVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYG------DQNSRLVRAVREGM ...: . . . :... : .: .:.::::: ... .:. ... . .. .. . CCDS58 LMFHGPAQEALGYFESAGYHCEAYNNPADFFLDIINGDSTAVALNREEDFKATEIIEPSK 270 280 290 300 310 320 350 360 370 380 390 pF1KE4 CDSDHKRDLGGDAEVNPFLWHRPSEE--DSSSMEGCHSFSA----SCLTQFCILF----K :. . :. . :: .... . : . :. : ..... : :.:: . : CCDS58 QDKPLIEKLA-EIYVNSSFYKETKAELHQLSGGEKKKKITVFKEISYTTSFCHQLRWVSK 330 340 350 360 370 380 400 410 420 430 440 450 pF1KE4 RTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAAL :.: ... . . .: . .::.:: .:.:. :.. . . .: ::: :... CCDS58 RSFKNLLGNPQASIAQIIVTVVLGLVIGAIYFGLKNDSTGIQNRAGVLFFLTTNQCFSSV 390 400 410 420 430 440 460 470 480 490 500 510 pF1KE4 MPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKTMADV-PFQIMFPVAYCSIVYWMTS-QP .: : .: .:..:... .: ...:.:.: ..:. :.... . . :::.: . .: CCDS58 -SAVELFVVEKKLFIHEYISGYYRVSSYFLGKLLSDLLPMRMLPSIIFTCIVYFMLGLKP 450 460 470 480 490 500 520 530 540 550 560 570 pF1KE4 SDAVRFVLFAALGTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDT . . ::.. .: :.. :.:..: :.:... ..:::.. . . ... CCDS58 KADAFFVMMFTL-MMVAYSASSMALAIAAGQSVVSVATLLMTICFVFMMVCWSISQPLHL 510 520 530 540 550 560 580 590 600 610 620 630 pF1KE4 IPTYLQWMSYISYVRYGFEGVILSIYGLDREDLHCDIDETCHFQKSEAILRELDVENAKL CCDS58 GCHGFSTSAFHDMDLRLCSIMNFWDKTSAQDSMQQETILVTMQHVLAKNIW 570 580 590 600 610 >>CCDS3628.1 ABCG2 gene_id:9429|Hs108|chr4 (655 aa) initn: 740 init1: 369 opt: 620 Z-score: 725.8 bits: 144.6 E(32554): 4.1e-34 Smith-Waterman score: 927; 29.3% identity (66.5% similar) in 600 aa overlap (89-656:56-650) 60 70 80 90 100 110 pF1KE4 AQRFSSLPRRAAVNIEFRDLSYSVPEGPWWRKKGYKTLLKGISGKFNSGELVAIMGPSGA :: : .:..:.: .. : : ::.::.:. CCDS36 NDLKAFTEGAVLSFHNICYRVKLKSGFLPCRKPVEKEILSNINGIMKPG-LNAILGPTGG 30 40 50 60 70 80 120 130 140 150 160 170 pF1KE4 GKSTLMNILAGYRE-TGMKGAVLINGLPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVS :::.:...::. .. .:..: ::::: :: :. : :..:::... :::.: .. : CCDS36 GKSSLLDVLAARKDPSGLSGDVLINGAPRPAN-FKCNSGYVVQDDVVMGTLTVRENLQFS 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE4 AHLKLQEK--DEGRREMVKEILTALGLLSCANTRTGS-----LSGGQRKRLAIALELVNN : :.: .. . : ..... ::: . :....:. .:::.::: .:..::... CCDS36 AALRLATTMTNHEKNERINRVIQELGLDKVADSKVGTQFIRGVSGGERKRTSIGMELITD 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE4 PPVMFFDEPTSGLDSASCFQVVSLMKGLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQ : ..:.::::.::::.. :. :.: ... ::.:: .:::: ..:.:::.: .:..:. CCDS36 PSILFLDEPTTGLDSSTANAVLLLLKRMSKQGRTIIFSIHQPRYSIFKLFDSLTLLASGR 210 220 230 240 250 260 300 310 320 330 340 pF1KE4 CVYRGKVCNLVPYLRDLGLNCPTYHNPADFVMEVASGEYG------DQNSRLVRAVREGM ...: . . . :... : .: .:.::::: ... .:. ... . .. .. . CCDS36 LMFHGPAQEALGYFESAGYHCEAYNNPADFFLDIINGDSTAVALNREEDFKATEIIEPSK 270 280 290 300 310 320 350 360 370 380 390 pF1KE4 CDSDHKRDLGGDAEVNPFLWHRPSEE--DSSSMEGCHSFSA----SCLTQFCILF----K :. . :. . :: .... . : . :. : ..... : :.:: . : CCDS36 QDKPLIEKLA-EIYVNSSFYKETKAELHQLSGGEKKKKITVFKEISYTTSFCHQLRWVSK 330 340 350 360 370 380 400 410 420 430 440 450 pF1KE4 RTFLSIMRDSVLTHLRITSHIGIGLLIGLLYLGIGNEAKKVLSNSGFLFFSMLFLMFAAL :.: ... . . .: . .::.:: .:.:. :.. . . .: ::: :... CCDS36 RSFKNLLGNPQASIAQIIVTVVLGLVIGAIYFGLKNDSTGIQNRAGVLFFLTTNQCFSSV 390 400 410 420 430 440 460 470 480 490 500 510 pF1KE4 MPTVLTFPLEMGVFLREHLNYWYSLKAYYLAKTMADV-PFQIMFPVAYCSIVYWMTS-QP .: : .: .:..:... .: ...:.:.: ..:. :.... . . :::.: . .: CCDS36 -SAVELFVVEKKLFIHEYISGYYRVSSYFLGKLLSDLLPMRMLPSIIFTCIVYFMLGLKP 450 460 470 480 490 500 520 530 540 550 560 570 pF1KE4 SDAVRFVLFAALGTMTSLVAQSLGLLIGAASTSLQVATFVGPVTAIPVLLFSGFFVSFDT . . ::.. .: :.. :.:..: :.:... ..:::.. . . ...:::..:.. : CCDS36 KADAFFVMMFTL-MMVAYSASSMALAIAAGQSVVSVATLLMTICFVFMMIFSGLLVNLTT 510 520 530 540 550 560 580 590 600 610 620 pF1KE4 IPTYLQWMSYISYVRYGFEGVILSIY-GLDR-EDLHCDIDETCHFQKS---EAILRE-LD : ..:.:..:.: :::: .. . . : . :. .. :.. : .... .: CCDS36 IASWLSWLQYFSIPRYGFTALQHNEFLGQNFCPGLNATGNNPCNYATCTGEEYLVKQGID 570 580 590 600 610 620 630 640 650 660 pF1KE4 VENAKLYLDFIVLGIFFISLRLIAYFVLRYKIRAER . :. . ..:. ... . :::. : . CCDS36 LSPWGLWKNHVALACMIVIFLTIAYLKLLFLKKYS 630 640 650 >>CCDS1815.1 ABCG8 gene_id:64241|Hs108|chr2 (673 aa) initn: 726 init1: 347 opt: 508 Z-score: 594.3 bits: 120.3 E(32554): 8.8e-27 Smith-Waterman score: 803; 26.1% identity (60.6% similar) in 624 aa overlap (73-649:47-665) 50 60 70 80 pF1KE4 DLLNGHLKKVDNNLTEAQRFSSLPRRAAVNIEFRDLSYSVP---EGPW----------WR .: :::.:.: . :: : CCDS18 PQDTSGLQDRLFSSESDNSLYFTYSGQPNTLEVRDLNYQVDLASQVPWFEQLAQFKMPWT 20 30 40 50 60 70 90 100 110 120 130 140 pF1KE4 KKGYKTL----LKGISGKFNSGELVAIMGPSGAGKSTLMNILAGYRETGM--KGAVLING . . .. ....: : ::...::.: :: :...:.....: . : .: . ::: CCDS18 SPSCQNSCELGIQNLSFKVRSGQMLAIIGSSGCGRASLLDVITGRGHGGKIKSGQIWING 80 90 100 110 120 130 150 160 170 180 190 200 pF1KE4 LPRDLRCFRKVSCYIMQDDMLLPHLTVQEAMMVSAHLKLQE--KDEGRREMVKEILTALG : . . :: .. : ..:::.:::.:.. :...: . .. : . :..... : CCDS18 QPSSPQLVRKCVAHVRQHNQLLPNLTVRETLAFIAQMRLPRTFSQAQRDKRVEDVIAELR 140 150 160 170 180 190 210 220 230 240 250 pF1KE4 LLSCANTRTGS-----LSGGQRKRLAIALELVNNPPVMFFDEPTSGLDSASCFQVVSLMK : .::.::.:. ::::.:.:..:...:. :: ....::::::::: . ..:. .. CCDS18 LRQCADTRVGNMYVRGLSGGERRRVSIGVQLLWNPGILILDEPTSGLDSFTAHNLVKTLS 200 210 220 230 240 250 260 270 280 290 300 310 pF1KE4 GLAQGGRSIICTIHQPSAKLFELFDQLYVLSQGQCVYRGKVCNLVPYLRDLGLNCPTYHN ::.:.: .. ..::: . .:.::: . ....: .: : . ..: :. .: :: : : CCDS18 RLAKGNRLVLISLHQPRSDIFRLFDLVLLMTSGTPIYLGAAQHMVQYFTAIGYPCPRYSN 260 270 280 290 300 310 320 330 340 350 360 370 pF1KE4 PADFVMEVASGEYGDQNSRLVRAVREGMCDSDHKRDLGGDAEVNPFLWHRPS---EEDSS :::: ....: . .....: :.:: .: : ... :::. . .::. CCDS18 PADFYVDLTSIDRRSREQEL--ATREKA-QSLAALFLEKVRDLDDFLWKAETKDLDEDTC 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 SMEGCHSFSASCLT----------QFCILFKRTFLSIMRDSVLTHLRITSHIGIGLLIGL . ....:: :: :..: . . .:: .. . ... ::. CCDS18 VESSVTPLDTNCLPSPTKMPGAVQQFTTLIRRQISNDFRDLPTLLIHGAEACLMSMTIGF 380 390 400 410 420 430 430 440 450 460 470 480 pF1KE4 LYLGIGNEAKKVLSNSGFLFFSMLFLMFAALMPTVLTFPLEMGVFLREHLNYWYSLKAYY ::.: :. . ......::. .. : ... .. : ... : . :. :. CCDS18 LYFGHGSIQLSFMDTAALLFMIGALIPFNVILDVISKCYSERAMLYYELEDGLYTTGPYF 440 450 460 470 480 490 490 500 510 520 530 540 pF1KE4 LAKTMADVPFQIMFPVAYCSIVYWMTSQPSDAVRFVLFAALGTMTSLVAQSLGLLIGAAS .:: ....: . . . : .::... :.: : .. . . ..: .: CCDS18 FAKILGELPEHCAYIIIYGMPTYWLANLRPGLQPFLLHFLLVWLVVFCCRIMALAAAALL 500 510 520 530 540 550 550 560 570 580 590 600 pF1KE4 TSLQVATFVGPVTAIPVLLFSGFFVSFDTIPTYLQWMSYISYVRYGFEGVILSIYGLDRE ....:.: . . : .::....... : :.: .:..:. ::: ...: ..:. CCDS18 PTFHMASFFSNALYNSFYLAGGFMINLSSLWTVPAWISKVSFLRWCFEG-LMKIQ-FSRR 560 570 580 590 600 610 610 620 630 640 650 pF1KE4 DLHCDIDETCHFQKSEAILRELDVENAKLY-LDFIVLGI-------FFISLRLIAYFVLR . . . ... :: ..... :: . .::.:. ...:::.: CCDS18 TYKMPLGNLTIAVSGDKILSVMELDSYPLYAIYLIVIGLSGGFMVLYYVSLRFIKQKPSQ 620 630 640 650 660 670 660 pF1KE4 YKIRAER CCDS18 DW 662 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:01:05 2016 done: Sun Nov 6 00:01:06 2016 Total Scan time: 3.580 Total Display time: 0.200 Function used was FASTA [36.3.4 Apr, 2011]