FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDB1439, 2273 aa
1>>>pF1KSDB1439 2273 - 2273 aa - 2273 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.0006+/-0.00116; mu= 18.5653+/- 0.070
mean_var=129.7942+/-25.381, 0's: 0 Z-trim(105.8): 72 B-trim: 0 in 0/52
Lambda= 0.112576
statistics sampled from 8580 (8650) to 8580 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.266), width: 16
Scan time: 6.360
The best scores are: opt bits E(32554)
CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273) 15305 2499.0 0
CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146) 2882 481.3 2.1e-134
CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 2288 384.9 2.5e-105
CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 2246 378.0 2.7e-103
CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 1862 315.7 1.6e-84
CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 1862 315.7 1.8e-84
CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058) 1297 224.1 1.3e-56
CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 1130 196.7 7.8e-49
CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 753 135.4 2e-30
CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 753 135.4 2e-30
CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 731 131.9 2.4e-29
CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 714 129.1 1.6e-28
CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 709 128.3 2.9e-28
CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 689 125.0 2.6e-27
>>CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273 aa)
initn: 15305 init1: 15305 opt: 15305 Z-score: 13430.6 bits: 2499.0 E(32554): 0
Smith-Waterman score: 15305; 100.0% identity (100.0% similar) in 2273 aa overlap (1-2273:1-2273)
10 20 30 40 50 60
pF1KSD MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD LINSQVRPEQFAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LINSQVRPEQFAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD EDTLYANVDFFKLFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLWVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 EDTLYANVDFFKLFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLWVT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD RPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 RPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPIY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD SYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 SYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD LEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGITAEAILN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGITAEAILN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD FLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD LLEENMFWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LLEENMFWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD FRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIFMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIFMV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD LAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIFIM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIFIM
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD HGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 HGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCF
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD AWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 AWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSM
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD QMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 QMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD TEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYENQITA
::::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::
CCDS74 TEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGRPAVDRLNITFYENQITA
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD FLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTV
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD AEHMLFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 AEHMLFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD KVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 KVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYC
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD SGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 SGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQV
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD LDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLS
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD SFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 SFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVC
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 SPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLP
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KSD ATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGF
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KSD GNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 GNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLP
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KSD ECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGI
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KSD SIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 SIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFN
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KSD NKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 NKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDA
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KSD VVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 VVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAG
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KSD LVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANL
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KSD FIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYAR
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KSD FGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDD
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KSD VAEERQRIITGGNKTDILRLHELTKIYPGTSSPAVDRLCVGVRPGECFGLLGVNGAGKTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 VAEERQRIITGGNKTDILRLHELTKIYPGTSSPAVDRLCVGVRPGECFGLLGVNGAGKTT
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KSD TFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGREHLYLYARLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 TFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGREHLYLYARLR
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KSD GVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPPLVLLDEPTTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 GVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPPLVLLDEPTTG
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KSD MDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCTRLAIMVKGAFRCMGTIQHLKSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 MDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCTRLAIMVKGAFRCMGTIQHLKSK
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KSD FGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQVSSSSLARIFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 FGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQVSSSSLARIFQ
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270
pF1KSD LLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAGASRQAQD
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAGASRQAQD
2230 2240 2250 2260 2270
>>CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146 aa)
initn: 5472 init1: 1357 opt: 2882 Z-score: 2526.6 bits: 481.3 E(32554): 2.1e-134
Smith-Waterman score: 6334; 45.1% identity (70.3% similar) in 2286 aa overlap (1-2257:1-2109)
10 20 30 40 50 60
pF1KSD MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA
:.: :..::::::. :.:: ....:::.::: ::..:. .:...: :::::::::
CCDS12 MAFWTQLMLLLWKNFMYRRRQPVQLLVELLWPLFLFFILVAVRHSHPPLEHHECHFPNKP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ
.:::: .:::::..::::: :: . :::: :: .::.:.:...:. : . .: .: :
CCDS12 LPSAGTVPWLQGLICNVNNTCFPQLTPGEEPGRLSNFNDSLVSRLLADARTVLGGA--SA
70 80 90 100 110
130 140 150 160 170 180
pF1KSD HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL
: : :.... ::: :.:.
CCDS12 H-----RTLAGLGKLIATLR------AARS------------------------------
120 130
190 200 210 220 230 240
pF1KSD LINSQVRPEQFAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWI
..: .: . . : . :.: :: .. : .:. : :
CCDS12 --TAQPQPTKQSPLEPPML--DVA---ELLTSLL-----------RTESLGLALGQAQ--
140 150 160 170
250 260 270 280 290 300
pF1KSD EDTLYANVDFFKLFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLWVT
. : .::.. :.. ::.. :. .:
CCDS12 --------------EPLHSLLEAAE-------------DLA---QELLALRSLVEL----
180 190 200
310 320 330 340 350
pF1KSD RPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVL-SFNWYEDNNYKAFLGIDSTRKDPI
: :.: :. . . .::. ::. .: .: : :.:::: .. ..: . :
CCDS12 RALLQR--PRGTSGPLELLSEALCSV-RGPSSTVGPSLNWYEASDLMELVGQEPESALP-
210 220 230 240 250
360 370 380 390 400 410
pF1KSD YSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFE
: . :. :: .:.:.::... :: :::..::.:..::.: .:... ..: :::
CCDS12 ---DSSLSPACSELIGALDSHPLSRLLWRRLKPLILGKLLFAPDTPFTRKLMAQVNRTFE
260 270 280 290 300 310
420 430 440 450 460 470
pF1KSD ELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGIT-AEAI
:: .: . ..:: .::.:. :...:... :.. : ..: :: : ::.
CCDS12 ELTLLRDVREVWEMLGPRIFTFMNDSSNVAMLQRLL---QMQDEGRRQPRPGGRDHMEAL
320 330 340 350 360 370
480 490 500 510 520 530
pF1KSD LNFLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRA
.:: : ....:.: . . . ... ::: :::.:. .:. :..::
CCDS12 RSFLDPGS--------GGYSWQDAHADVGHLVGTLGRVTECLSLDKLEAAPSEAALVSRA
380 390 400 410 420
540 550 560 570 580 590
pF1KSD LSLLEENMFWAGVVF--------PDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWD
:.:: :. ::::::: : .: . : ::. ::::::::: .::::.::.::
CCDS12 LQLLAEHRFWAGVVFLGPEDSSDPTEHPTPDLGPGHVRIKIRMDIDVVTRTNKIRDRFWD
430 440 450 460 470 480
600 610 620 630 640 650
pF1KSD SGPRADPVEDFRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMII
:: :::. :.::.::::.::::.::.. .: :. .:.:::::::::.::: :. .
CCDS12 PGPAADPLTDLRYVWGGFVYLQDLVERAAVRVLSGANPRAGLYLQQMPYPCYVDDVFLRV
490 500 510 520 530 540
660 670 680 690 700 710
pF1KSD LNRCFPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSM
:.: .:.:..:::::::..:::..: ::: ::..:.. .:.: ::.: :::. .. . .
CCDS12 LSRSLPLFLTLAWIYSVTLTVKAVVREKETRLRDTMRAMGLSRAVLWLGWFLSCLGPFLL
550 560 570 580 590 600
720 730 740 750 760 770
pF1KSD SIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYF
: ::.. . : :: :: : ..:::: ::..::. ::::.:::.:.:::::.:. ::
CCDS12 SAALLVLVLKLGDILPYSHPGVVFLFLAAFAVATVTQSFLLSAFFSRANLAAACGGLAYF
610 620 630 640 650 660
780 790 800 810 820 830
pF1KSD TLYLPHILCFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTE
.::::..:: ::.::. : . :.::::::::::: : :. .:::: : :: :.:. ::
CCDS12 SLYLPYVLCVAWRDRLPAGGRVAASLLSPVAFGFGCESLALLEEQGEGAQWHNVGTRPT-
670 680 690 700 710 720
840 850 860 870 880 890
pF1KSD GDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTRE
.: ::. ..:::::.::: .:::. : ::.:: : :: : ...::: :. :
CCDS12 ADVFSLAQVSGLLLLDAALYGLATWYLEAVCPGQYGIPEPWNFPFRRSYW-----CGPRP
730 740 750 760 770
900 910 920 930 940 950
pF1KSD ERALEKTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLN
.. : : : :. . :. :: ::: :..: : : :::. :.
CCDS12 PKS-----PAPCPT--PLDPK----VLVEEAPPGLSPGVSVRSLEKRFPGSPQPALRGLS
780 790 800 810 820
960 970 980 990 1000 1010
pF1KSD ITFYENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQ
. ::...:::::::::::::::::::.::.::..:.... :.:...:. :.: ::.:::
CCDS12 LDFYQGHITAFLGHNGAGKTTTLSILSGLFPPSGGSAFILGHDVRSSMAAIRPHLGVCPQ
830 840 850 860 870 880
1020 1030 1040 1050 1060 1070
pF1KSD HNILFHHLTVAEHMLFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKL
.:.:: ::: ::. ::..::: : . :.. .:.:.:: :.. ... :::::::::
CCDS12 YNVLFDMLTVDEHVWFYGRLKGLSAAVVGPEQDRLLQDVGLVSKQSVQTRHLSGGMQRKL
890 900 910 920 930 940
1080 1090 1100 1110 1120 1130
pF1KSD SVAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRI
:::::::: ..::::::::.:::: :::.::.:::::: :::.:.::::.:::.:::::.
CCDS12 SVAIAFVGGSQVVILDEPTAGVDPASRRGIWELLLKYREGRTLILSTHHLDEAELLGDRV
950 960 970 980 990 1000
1140 1150 1160 1170 1180
pF1KSD AIIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGS---EGTCSCSSKGFSTT
:..: ::: : :.::::. .:.: :::::. . ...:.. ::. . .. . .
CCDS12 AVVAGGRLCCCGSPLFLRRHLGSGYYLTLVKARLPLTTNEKADTDMEGSVDTRQEKKNGS
1010 1020 1030 1040 1050 1060
1190 1200 1210 1220 1230 1240
pF1KSD CPAHVDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLF
..: ::. :. .: : :: :.::: . .::...:: . . ..:.::
CCDS12 QGSRVG--TPQ---------LLALVQHWVPGARLVEELPHELVLVLPYTGAHDGSFATLF
1070 1080 1090 1100 1110
1250 1260 1270 1280 1290 1300
pF1KSD RELEETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGP-
:::. ::.: :...::::: ::::::::.:. . . :. . : : :
CCDS12 RELDTRLAELRLTGYGISDTSLEEIFLKVVEECAADTDMEDGSCGQ-------HLCTGIA
1120 1130 1140 1150 1160 1170
1310 1320 1330 1340 1350
pF1KSD ----REKAGQTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLN---TGTQLVLQHVQALL
. . ::.. . . : :: :. : . ::. : :. :..::::
CCDS12 GLDVTLRLKMPPQETALEN-GEPA----GSAPETDQGSGPDAVGRVQGWALTRQQLQALL
1180 1190 1200 1210 1220
1360 1370 1380 1390 1400 1410
pF1KSD VKRFQHTIRSHKDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSM
.::: . ::.. ..::::::: :: :::..:...::::.:::: : : .:: : .:::
CCDS12 LKRFLLARRSRRGLFAQIVLPALFVGLALVFSLIVPPFGHYPALRLSPTMYGAQVSFFSE
1230 1240 1250 1260 1270 1280
1420 1430 1440 1450 1460 1470
pF1KSD DEPGSEQFTVLADVLLNKPGFGNRCLKEGWLPEYPCGNSTP-WKTPSVSPNITQLFQKQK
: ::. . : ..::.. : : : : .:. ...: : ...... . .
CCDS12 DAPGDPGRARLLEALLQEAG----------LEEPPVQHSSHRFSAPEVPAEVAKVLASGN
1290 1300 1310 1320 1330
1480 1490 1500 1510 1520 1530
pF1KSD WTQVNPSPSCRCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTY
:: .:::.:.:: .::.:: .::: :::: . : :..:.:: ::.::::::::
CCDS12 WTPESPSPACQCSRPGARRLLPDCPAAAGGPPPPQAVTGSGEVVQNLTGRNLSDFLVKTY
1340 1350 1360 1370 1380 1390
1540 1550 1560 1570 1580 1590
pF1KSD PALIRSSLKSKFWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMN-VSGGPITRE
: :.:..::.: :::: ::::.:.::. : .: .:. : . .: ... . :: . :
CCDS12 PRLVRQGLKTKKWVNEVRYGGFSLGGRDPGLP-SGQELGRSVEELWALLSPLPGGALDR-
1400 1410 1420 1430 1440 1450
1600 1610 1620 1630 1640 1650
pF1KSD ASKEIPDFLKHLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVI
. :.. . . :...:..:.::::::::..:.:.: : :::::: :: . . ..::..
CCDS12 VLKNLTAWAHSLDAQDSLKIWFNNKGWHSMVAFVNRASNAILRAHLPPGPARHAHSITTL
1460 1470 1480 1490 1500 1510
1660 1670 1680 1690 1700 1710
pF1KSD SQPLNLTKEQLSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISG
..::::::::::: .....:::..:.:::.:.::::::::.: ::.:::...::::...:
CCDS12 NHPLNLTKEQLSEGALMASSVDVLVSICVVFAMSFVPASFTLVLIEERVTRAKHLQLMGG
1520 1530 1540 1550 1560 1570
1720 1730 1740 1750 1760 1770
pF1KSD VSPTTYWVTNFLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPM
.::: ::. :::::. :: : : .:: ::..::..::..: :::::. :::::::.. :.
CCDS12 LSPTLYWLGNFLWDMCNYLVPACIVVLIFLAFQQRAYVAPANLPALLLLLLLYGWSITPL
1580 1590 1600 1610 1620 1630
1780 1790 1800 1810 1820 1830
pF1KSD MYPASFLFDVPSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFP
::::::.:.:::::::.:.: :::::::.: ::.:::: ... : . . .:......::
CCDS12 MYPASFFFSVPSTAYVVLTCINLFIGINGSMATFVLELFSDQK-LQEVSRILKQVFLIFP
1640 1650 1660 1670 1680 1690
1840 1850 1860 1870 1880 1890
pF1KSD HFCLGRGLIDLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQ
::::::::::.. .::..:.. :.:... .:..:...::::.:::..: ...:.:::.:
CCDS12 HFCLGRGLIDMVRNQAMADAFERLGDRQFQSPLRWEVVGKNLLAMVIQGPLFLLFTLLLQ
1700 1710 1720 1730 1740 1750
1900 1910 1920 1930 1940 1950
pF1KSD RHFFLSQWIAEPTKE--PIV-DEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSPA
.. :: . .: . :.. .::.:::.::.:.. :... :.: :..:::.: : ::
CCDS12 HR---SQLLPQPRVRSLPLLGEEDEDVARERERVVQGATQGDVLVLRNLTKVYRGQRMPA
1760 1770 1780 1790 1800
1960 1970 1980 1990 2000 2010
pF1KSD VDRLCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM
:::::.:. ::::::::::::::::.::.:.:::: .. :.:..::.:. . : .: .:
CCDS12 VDRLCLGIPPGECFGLLGVNGAGKTSTFRMVTGDTLASRGEAVLAGHSVAREPSAAHLSM
1810 1820 1830 1840 1850 1860
2020 2030 2040 2050 2060 2070
pF1KSD GYCPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGG
::::: ::: ::::::::: : ::::::: .. ..:. .. :::. ::: :::::::
CCDS12 GYCPQSDAIFELLTGREHLELLARLRGVPEAQVAQTAGSGLARLGLSWYADRPAGTYSGG
1870 1880 1890 1900 1910 1920
2080 2090 2100 2110 2120 2130
pF1KSD NKRKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECE
:::::.::.::.: : .:.::::::::::.:::.::: .....::::.:.::::::::::
CCDS12 NKRKLATALALVGDPAVVFLDEPTTGMDPSARRFLWNSLLAVVREGRSVMLTSHSMEECE
1930 1940 1950 1960 1970 1980
2140 2150 2160 2170 2180 2190
pF1KSD ALCTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFP
:::.::::::.: :::.:. ::::..:. :. .:... . ... :. : ..::
CCDS12 ALCSRLAIMVNGRFRCLGSPQHLKGRFAAGHTLTLRVPAARSQ------PAAAFVAAEFP
1990 2000 2010 2020 2030 2040
2200 2210 2220 2230 2240 2250
pF1KSD GSVQRERHYNMLQFQVSSS---SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQ
:. :: : . :.::. . .:::.: : : .:..::.:: :..::. :.:.
CCDS12 GAELREAHGGRLRFQLPPGGRCALARVFGELAVHGAEHGVEDFSVSQTMLEEVFLYFSKD
2050 2060 2070 2080 2090 2100
2260 2270
pF1KSD QTESHDLPLHPRAAGASRQAQD
: ...:
CCDS12 QGKDEDTEEQKEAGVGVDPAPGLQHPKRVSQFLDDPSTAETVL
2110 2120 2130 2140
>>CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436 aa)
initn: 4208 init1: 1041 opt: 2288 Z-score: 2004.4 bits: 384.9 E(32554): 2.5e-105
Smith-Waterman score: 4627; 37.1% identity (64.2% similar) in 2369 aa overlap (97-2255:88-2368)
70 80 90 100 110 120
pF1KSD LPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNS----ILARVYRDFQELLMNAPESQHL
: :: .: :. : .: . : :
CCDS43 TAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSL
60 70 80 90 100 110
130 140 150 160 170
pF1KSD GRIWTELHILSQFMDTLRTHP-------ERIAGRGIRIRDILKDEETLTLFLIKNIGLSD
: .::. : : ...: . : .: . .. . .. .. . : :: .:..: .
CCDS43 G---SELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPN
120 130 140 150 160 170
180 190 200
pF1KSD SVVYLLINSQVRPEQFAH--------------------------GVPDLALKDIACSEAL
:.. :. ..: : . : : : . .... . ::
CCDS43 STAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPAL
180 190 200 210 220 230
210 220 230 240 250
pF1KSD LERF--------------IIFSQRRGAKTVRYALCSLSQGT----LQWIEDTLYANVDFF
::.. . ::. . . : :.:: . .. .. . : ..:
CCDS43 LEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVA
240 250 260 270 280 290
260 270 280 290 300
pF1KSD KLFRVL----PTLLDSRSQGINLRSWGGILSDM--SPRIQEFIHRPSMQDLLW-----VT
:. . : :. :: :. : ..:.:. . .. . . : :: .
CCDS43 KVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGACTG
300 310 320 330 340 350
310 320 330 340 350
pF1KSD R----PLMQNGGPETFT---KLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDS
: : :: . : .:: . : : ... :. ... .::. . .
CCDS43 RTPGPPASGAGGAANGTGAGAVMGPNATAEEGAPSAAA---LATPDTLQGQCSAFVQLWA
360 370 380 390 400 410
360 370 380 390 400
pF1KSD TRKDPIYSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPL--LMG---KILYTPDSPAAR
. :: . :: .. : .:. : : :: ::::.: . .
CCDS43 GLQ-PILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVD
420 430 440 450 460 470
410 420 430 440 450 460
pF1KSD RILKNANSTFEELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQL
:.. .:: :: . .: . ...: ... .: :.... .. .: .:.. .
CCDS43 RVILKANETFAFVGNVTHYAQVWLNISAEIRSFLEQGRLQQHLR----------WLQQYV
480 490 500 510 520
470 480 490 500 510 520
pF1KSD GEEGITAEAILNFLYKGPRESQADDMA---NFDWRDIFNITDRTLRLVNQYLECLVLDKF
.: . ::. : . : . :... .. . .. : . :.. . .: :
CCDS43 AELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIF
530 540 550 560 570 580
530 540 550 560 570 580
pF1KSD ESYNDETQLTQRALSL-LEENM-FWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNK
... :: .... .:. ..:. .:.:.: .::::::.::::.. . .::::.
CCDS43 KGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKD--GSLPPHVHYKIRQNSSFTEKTNE
590 600 610 620 630
590 600 610 620 630 640
pF1KSD IKDRYWDSGPRADPVEDFRYIWGGFAYLQDMVEQGITRSQVQAEA--PVGIYLQQMPYPC
:. :: :: . : : ::...:::.:..: . : .. : : :.:..::::
CCDS43 IRRAYWRPGPNTGGRFYFLY---GFVWIQDMMERAIIDTFVGHDVVEP-GSYVQMFPYPC
640 650 660 670 680 690
650 660 670 680 690 700
pF1KSD FVDDSFMIILNRCFPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWF
.. :.:...... .:. ::..:.:::.::.. :: ::: ::::..:..:..::: : .::
CCDS43 YTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWF
700 710 720 730 740 750
710 720 730 740 750 760
pF1KSD LDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLA
. .: .:.:. :: .. .:..: .: :..::: ....::::.:::.:...:::.::
CCDS43 ITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLA
760 770 780 790 800 810
770 780 790 800 810
pF1KSD AACSGVIYFTLYLPHILCFAWQ----DRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGL
.::.:.::: :.:.. . :..:: : .::.: .:::.:..:.. .: :.
CCDS43 SACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGV
820 830 840 850 860 870
820 830 840 850 860 870
pF1KSD GLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQE
:.:: ....::.:::.:..::.. :...::.:::.:.::.. : :: :: : :::: ::.
CCDS43 GIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQK
880 890 900 910 920 930
880 890 900 910 920 930
pF1KSD SYWLG-GEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFER-----EHPGWVPGV-C
::::: :. . . .: :. :: . .... ::. :.: .: : :
CCDS43 SYWLGSGRTEAWEWSWPWARTPRLSVMEED--QACAMESRRFEETRGMEEEPTHLPLVVC
940 950 960 970 980 990
940 950 960 970 980 990
pF1KSD VKNLVKIFEPCGQPAVDRLNITFYENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVG
: .:.:... . :...:....::::...::::::::::::.::::::.:::::.. .
CCDS43 VDKLTKVYKDDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIY
1000 1010 1020 1030 1040 1050
1000 1010 1020 1030 1040 1050
pF1KSD GRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEEAQLEMEAMLEDTG
:.::.: .: .:..::::::::.:: .::: ::. ::..::. .::: . ::. :.::
CCDS43 GHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLE
1060 1070 1080 1090 1100 1110
1060 1070 1080 1090 1100 1110
pF1KSD LHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSG
: .::. .: :::::.::::::::::: ....::::::.:::::.::.::::.:::. :
CCDS43 LSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPG
1120 1130 1140 1150 1160 1170
1120 1130 1140 1150 1160 1170
pF1KSD RTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQR
:::..::::::::::::::::::..:.: : :.:::::. .: : ::::.. ..
CCDS43 RTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKR----PAEP
1180 1190 1200 1210 1220
1180 1190 1200 1210 1220 1230
pF1KSD KGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELI
: . :.... :... :. . : .. . . .:: :: . ::
CCDS43 GGPQ------EPGLASSPPGRAP-LSSCSEL-----QVSQFIRKHVASCLLVSDTSTELS
1230 1240 1250 1260 1270
1240 1250 1260 1270 1280 1290
pF1KSD FLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGA
..::.. :. :. ::..::..: : :::::. :: :::.::::.:...: . .
CCDS43 YILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADV
1280 1290 1300 1310 1320 1330
1300 1310 1320 1330
pF1KSD QQKRENVNP--RHPCLGPREKAGQTPQDSNVCSPGAP---------AAHPEG--------
...:..: : . : : . .::. . :.. . : : ::
CCDS43 KESRKDVLPGAEGPASG-EGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVYG
1340 1350 1360 1370 1380 1390
1340 1350 1360 1370
pF1KSD --QP----PPEPEC---------------PGPQLNTGTQLVLQHVQALLVKRFQHTIRSH
.: : .:. : . : : ... ..::::::. . :.
CCDS43 DYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNS
1400 1410 1420 1430 1440 1450
1380 1390 1400 1410
pF1KSD KDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG-----------------QQ
: ...::.::: :: .:. ... .: .:. : :.: : : ..
CCDS43 KALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERRE
1460 1470 1480 1490 1500 1510
1420 1430 1440
pF1KSD YTFFSMDEPGSEQFT--------VLADVLLNKPG----------------------FGNR
: . . . .:.. : : .:..:. : .
CCDS43 YRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSM
1520 1530 1540 1550 1560 1570
1450 1460 1470 1480
pF1KSD CLKEGWLPEYPCGN---STPWKTPSVSP----------NIT--QLFQKQKWTQVNPSPS-
:: :.. : .: : .:: :: :.. . ::.. :
CCDS43 CL-ESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRL
1580 1590 1600 1610 1620 1630
1490 1500 1510 1520 1530 1540
pF1KSD ----CRCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIR
::. . : . :: ..:: :: .:. . .:: :.: .:.:..:. :
CCDS43 VREPVRCTCSAQGTGFS-CPSSVGGHPPQMRVV-TGDILTDITGHNVSEYLLFT------
1640 1650 1660 1670 1680
1550 1560 1570 1580 1590 1600
pF1KSD SSLKSKFWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIP
...: . .:::.:..:. : .: ...: :: :
CCDS43 ---SDRFRL--HRYGAITFGNVLKSIP----------ASFG----------TRA-----P
1690 1700 1710
1610 1620 1630 1640 1650 1660
pF1KSD DFLKHLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDR-SPEEYGITVISQPLN
..... .. .:..::::.:.. ..:: .::::::.:::.. .: ::::: ..:.:
CCDS43 PMVRKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMN
1720 1730 1740 1750 1760 1770
1670 1680 1690 1700 1710 1720
pF1KSD LTKEQLSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTT
:. .:: . : ..:.:.:: .: .:::::::::..:. :. .:.:::::.:: .:
CCDS43 KTSASLS-LDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPII
1780 1790 1800 1810 1820 1830
1730 1740 1750 1760 1770 1780
pF1KSD YWVTNFLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPAS
::..:..::..:: : : : :.. :. ::::: :.::...:.:::::.. :.:::::
CCDS43 YWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPAS
1840 1850 1860 1870 1880 1890
1790 1800 1810 1820 1830 1840
pF1KSD FLFDVPSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLG
: :.:::.::: : ::::::.... ::.:.:::... : :. :.. ...::.. ::
CCDS43 FWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLG
1900 1910 1920 1930 1940 1950
1850 1860 1870 1880 1890 1900
pF1KSD RGLIDLALSQAVTDVYARFGE-EHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFF
.::...: .. ... ::..:. .. .::.::.. ..: ::.::::: ::::.. : .:
CCDS43 HGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNF-
1960 1970 1980 1990 2000 2010
1910 1920 1930 1940 1950
pF1KSD LSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP---AVDRL
: . :.. :..: ::: ::::.. : .:......:::.: . . :::::
CCDS43 LRRPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRL
2020 2030 2040 2050 2060 2070
1960 1970 1980 1990 2000 2010
pF1KSD CVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCP
:.:::::::::::::::::::.:::::::: ..:.:.: : :.:.: .. .:.:..::::
CCDS43 CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCP
2080 2090 2100 2110 2120 2130
2020 2030 2040 2050 2060 2070
pF1KSD QFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRK
: ::. . ::.:::: ::.::::. .. .:..:....: :: ::: :::::::::::
CCDS43 QCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKRK
2140 2150 2160 2170 2180 2190
2080 2090 2100 2110 2120 2130
pF1KSD LSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCT
::::::::: : ...::::::::::.:::.:::.:...:. ::.::::::::::::::::
CCDS43 LSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALCT
2200 2210 2220 2230 2240 2250
2140 2150 2160 2170 2180 2190
pF1KSD RLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQ
::::::.: .::.:.:::::..:::::..:.. :: .. .. : .::. ::: ..
CCDS43 RLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQS-----VKDVVRFFNRNFPEAML
2260 2270 2280 2290 2300
2200 2210 2220 2230 2240 2250
pF1KSD RERHYNMLQFQVSSS--SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESH
.:::.. .:.:..: :::..:. . . . : ::.:::.:::::.:::::::.:...
CCDS43 KERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNL
2310 2320 2330 2340 2350 2360
2260 2270
pF1KSD DLPLHPRAAGASRQAQD
CCDS43 EQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLS
2370 2380 2390 2400 2410 2420
>>CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261 aa)
initn: 5519 init1: 2148 opt: 2246 Z-score: 1968.0 bits: 378.0 E(32554): 2.7e-103
Smith-Waterman score: 7617; 50.9% identity (77.2% similar) in 2274 aa overlap (6-2261:6-2236)
10 20 30 40 50 60
pF1KSD MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA
:..:::::: :.:.:: ....:..::: .::.:: .: . : : .:::::::::
CCDS67 MACWPQLRLLLWKNLTFRRRQTCQLLLEVAWPLFIFLILISVRLSYPPYEQHECHFPNKA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ
::::: :::.:::.::.:::::. :::::.::.:.:.:.::.::.. : ..::. . ..
CCDS67 MPSAGTLPWVQGIICNANNPCFRYPTPGEAPGVVGNFNKSIVARLFSDARRLLLYSQKDT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD HLGRIWTELHILSQFMDTLRTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYL
. . :. :.:. . .. .....:.: :.::.. :: .:..: :.:
CCDS67 SMKDMRKVLRTLQQI---------KKSSSNLKLQDFLVDNETFSGFLYHNLSLPKSTVDK
130 140 150 160 170
190 200 210 220 230
pF1KSD LINSQVRPEQ-FAHGVPDLALKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQW
.. ..: .. : .: .: : .. :. . :..: . : . : ::.: . :
CCDS67 MLRADVILHKVFLQGY-QLHLTSL-CNGSKSEEMIQL----GDQEVS-ELCGLPREKLAA
180 190 200 210 220
240 250 260 270 280 290
pF1KSD IEDTLYANVDFFK-LFRVLPTLLDSRSQGINLRSWGGILSDMSPRIQEFIHRPSMQDLLW
: .: .:.:..: ..:.: . :. . .. .: ... ::.. : .:.
CCDS67 AERVLRSNMDILKPILRTLNSTSPFPSKELA-EATKTLLHSLGTLAQELFSMRSWSDMRQ
230 240 250 260 270 280
300 310 320 330 340 350
pF1KSD VTRPLMQNGGPETFTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDP
. : . .. . :... .: ..::.::::: .. :.::::::::::..: ..:..:
CCDS67 EVMFLTNVNSSSSSTQIYQAVSRIVCGHPEGGGLKIKSLNWYEDNNYKALFGGNGTEEDA
290 300 310 320 330 340
360 370 380 390 400 410
pF1KSD IYSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTF
:: :: .:: :...:::.::..: :.: ::::.::::::::.::.:... ..:.::
CCDS67 ETFYDNSTTPYCNDLMKNLESSPLSRIIWKALKPLLVGKILYTPDTPATRQVMAEVNKTF
350 360 370 380 390 400
420 430 440 450 460 470
pF1KSD EELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNRQLGEEGITAEAI
.:: . : :::..:.:: :..:: .:...: : . : ..:: ::. :
CCDS67 QELAVFHDLEGMWEELSPKIWTFMENSQEMDLVRMLLDSRDNDHFWEQQLDGLDWTAQDI
410 420 430 440 450 460
480 490 500 510 520 530
pF1KSD LNFLYKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRA
. :: : :.. :... . . ::. :: :....: .....::. :.:.: :. : ...
CCDS67 VAFLAKHPEDVQSSNGSVYTWREAFNETNQAIRTISRFMECVNLNKLEPIATEVWLINKS
470 480 490 500 510 520
540 550 560 570 580 590
pF1KSD LSLLEENMFWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPV
. ::.: ::::.:: . : . :: ::::::::::: ::.:::::: ::: ::::::
CCDS67 MELLDERKFWAGIVFTGITPGSIELPHHVKYKIRMDIDNVERTNKIKDGYWDPGPRADPF
530 540 550 560 570 580
600 610 620 630 640 650
pF1KSD EDFRYIWGGFAYLQDMVEQGITRSQVQAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIF
::.::.:::::::::.:::.: : . .: .:.:.:::::::.::: :. ...: .:.:
CCDS67 EDMRYVWGGFAYLQDVVEQAIIRVLTGTEKKTGVYMQQMPYPCYVDDIFLRVMSRSMPLF
590 600 610 620 630 640
660 670 680 690 700 710
pF1KSD MVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIF
:.:::::::.. .:.:: ::: :::::.. .:..:...: .::..:. . .: ::...
CCDS67 MTLAWIYSVAVIIKGIVYEKEARLKETMRIMGLDNSILWFSWFISSLIPLLVSAGLLVVI
650 660 670 680 690 700
720 730 740 750 760 770
pF1KSD IMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHIL
. : .: :::: ..:.:: .:...::. :::.::.::.:.:::::.:.::::::::..:
CCDS67 LKLGNLLPYSDPSVVFVFLSVFAVVTILQCFLISTLFSRANLAAACGGIIYFTLYLPYVL
710 720 730 740 750 760
780 790 800 810 820 830
pF1KSD CFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLL
: :::: . :: .::::::::::: ::.. :::::.:.::.:. .::.: : :..
CCDS67 CVAWQDYVGFTLKIFASLLSPVAFGFGCEYFALFEEQGIGVQWDNLFESPVEEDGFNLTT
770 780 790 800 810 820
840 850 860 870 880 890
pF1KSD SMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTE
:..:::.:. .::...::.. ::::.:: : :::: .:::.: :.. ::..
CCDS67 SVSMMLFDTFLYGVMTWYIEAVFPGQYGIPRPWYFPCTKSYWFG--------EESDEKSH
830 840 850 860 870
900 910 920 930 940 950
pF1KSD PLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYENQI
: ... . : . .:.: :: ..::::... . ::: : ..:::.::
CCDS67 PGSNQKR-------ISEICMEEEPTHLKLGVSIQNLVKVYRDGMKVAVDGLALNFYEGQI
880 890 900 910 920
960 970 980 990 1000 1010
pF1KSD TAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHL
:.::::::::::::.::::::.::::::. . :.::.. ....::.::.:::::.:: :
CCDS67 TSFLGHNGAGKTTTMSILTGLFPPTSGTAYILGKDIRSEMSTIRQNLGVCPQHNVLFDML
930 940 950 960 970 980
1020 1030 1040 1050 1060 1070
pF1KSD TVAEHMLFYAQLKGKSQEEAQLEMEAMLEDTGL-HHKRNEEAQDLSGGMQRKLSVAIAFV
:: ::. :::.::: :..... ::: : :.:: : . ....::::::::::::.:::
CCDS67 TVEEHIWFYARLKGLSEKHVKAEMEQMALDVGLPSSKLKSKTSQLSGGMQRKLSVALAFV
990 1000 1010 1020 1030 1040
1080 1090 1100 1110 1120 1130
pF1KSD GDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGR
: .:::::::::.::::::::.::.::::::.:::::.:::::::::.::::::::..:.
CCDS67 GGSKVVILDEPTAGVDPYSRRGIWELLLKYRQGRTIILSTHHMDEADVLGDRIAIISHGK
1050 1060 1070 1080 1090 1100
1140 1150 1160 1170 1180 1190
pF1KSD LYCSGTPLFLKNCFGTGLYLTLVRK-MKNIQSQRKGSEGTCSCSSKGFS---TTCPAHVD
: : :. ::::: .::: :::::.: ... :. ..: .: : .: : .. : .
CCDS67 LCCVGSSLFLKNQLGTGYYLTLVKKDVESSLSSCRNSSSTVSYLKKEDSVSQSSSDAGLG
1110 1120 1130 1140 1150 1160
1200 1210 1220 1230 1240 1250
pF1KSD DLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEET
. ..: ::. . ... .:: ::.::: ::.:: ..:: . :. :.. ::.:...
CCDS67 SDHESDTLTIDVSAISNLIRKHVSEARLVEDIGHELTYVLPYEAAKEGAFVELFHEIDDR
1170 1180 1190 1200 1210 1220
1260 1270 1280 1290 1300
pF1KSD LADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGG---AQQKRENVNPRHPCLGP-REK
:.:::.::.:::.: ::::::::.:.: . : :...:. . .. :: : :
CCDS67 LSDLGISSYGISETTLEEIFLKVAEESGVDAETSDGTLPARRNRRAFGDKQSCLRPFTED
1230 1240 1250 1260 1270 1280
1310 1320 1330 1340 1350 1360
pF1KSD AGQTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRS
. :.::.. . . :. . : : .:. :. ::: ::. . ::
CCDS67 DAADPNDSDIDPESRETDLLSGM-----DGKGSYQVKGWKLTQQQFVALLWKRLLIARRS
1290 1300 1310 1320 1330 1340
1370 1380 1390 1400 1410 1420
pF1KSD HKDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTV
.: :.:::::::.:: .::..:...::::.::.: :.::.:..:::: : : : .
CCDS67 RKGFFAQIVLPAVFVCIALVFSLIVPPFGKYPSLELQPWMYNEQYTFVSNDAPEDTGTLE
1350 1360 1370 1380 1390 1400
1430 1440 1450 1460 1470 1480
pF1KSD LADVLLNKPGFGNRCLKEGWLPEYPC-GNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSC
: ..: . ::::.::.. . .:. :: .. : : : .: .:::. .::. ::::.:
CCDS67 LLNALTKDPGFGTRCMEGNPIPDTPCQAGEEEWTTAPVPQTIMDLFQNGNWTMQNPSPAC
1410 1420 1430 1440 1450 1460
1490 1500 1510 1520 1530 1540
pF1KSD RCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKS
.::. . ::: :: :::::::::: : ...:::::: :::::.::::: .: .:::.
CCDS67 QCSSDKIKKMLPVCPPGAGGLPPPQRKQNTADILQDLTGRNISDYLVKTYVQIIAKSLKN
1470 1480 1490 1500 1510 1520
1550 1560 1570 1580 1590 1600
pF1KSD KFWVNEQRYGGISIG-GKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLK
:.:::: ::::.:.: .. ..: . : . .... . .... . . . . :.
CCDS67 KIWVNEFRYGGFSLGVSNTQALPPSQE-VNDAIKQMKKHLKLAKDSSADRFLNSLGRFMT
1530 1540 1550 1560 1570 1580
1610 1620 1630 1640 1650 1660
pF1KSD HLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQ
:.:..:.:::::::::::. ::::: .::::::.: : ..: .::::....::::::.:
CCDS67 GLDTKNNVKVWFNNKGWHAISSFLNVINNAILRANLQKGENPSHYGITAFNHPLNLTKQQ
1590 1600 1610 1620 1630 1640
1670 1680 1690 1700 1710 1720
pF1KSD LSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTN
:::....:::::..:.:::::.:::::::::..::::::.:.:::::::::.:. ::..:
CCDS67 LSEVALMTTSVDVLVSICVIFAMSFVPASFVVFLIQERVSKAKHLQFISGVKPVIYWLSN
1650 1660 1670 1680 1690 1700
1730 1740 1750 1760 1770 1780
pF1KSD FLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDV
:.::. :: : : ::. ::: ::.:.:.: :::.:. :::::::.. :.::::::.: .
CCDS67 FVWDMCNYVVPATLVIIIFICFQQKSYVSSTNLPVLALLLLLYGWSITPLMYPASFVFKI
1710 1720 1730 1740 1750 1760
1790 1800 1810 1820 1830 1840
pF1KSD PSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLID
::::::.:. .:::::::.:. ::.:::: .:. : .: .:......::::::::::::
CCDS67 PSTAYVVLTSVNLFIGINGSVATFVLELFTDNK-LNNINDILKSVFLIFPHFCLGRGLID
1770 1780 1790 1800 1810 1820
1850 1860 1870 1880 1890 1900
pF1KSD LALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIA
.. .::..:. ::::.. ..:. :::.:.:::::.:::::.::.:.:.: .::. .
CCDS67 MVKNQAMADALERFGENRFVSPLSWDLVGRNLFAMAVEGVVFFLITVLIQYRFFIRPRPV
1830 1840 1850 1860 1870 1880
1910 1920 1930 1940 1950 1960
pF1KSD EPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSPAVDRLCVGVRPGEC
. :. :::.:: .:::::. ::...:::...:::::: .:::::.:::. ::::
CCDS67 NAKLSPLNDEDEDVRRERQRILDGGGQNDILEIKELTKIYRRKRKPAVDRICVGIPPGEC
1890 1900 1910 1920 1930 1940
1970 1980 1990 2000 2010 2020
pF1KSD FGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELL
:::::::::::..:::::::::::: ::: . .:::.:: ::::::::::::::: :::
CCDS67 FGLLGVNGAGKSSTFKMLTGDTTVTRGDAFLNKNSILSNIHEVHQNMGYCPQFDAITELL
1950 1960 1970 1980 1990 2000
2030 2040 2050 2060 2070 2080
pF1KSD TGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIG
:::::. ..: ::::: .:. ::..:.:..:::. :.. ::.::::::::::::.::::
CCDS67 TGREHVEFFALLRGVPEKEVGKVGEWAIRKLGLVKYGEKYAGNYSGGNKRKLSTAMALIG
2010 2020 2030 2040 2050 2060
2090 2100 2110 2120 2130 2140
pF1KSD CPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALCTRLAIMVKGA
::.:.::::::::::.:::.::: .:...:::.:::::::::::::::::.::::.:
CCDS67 GPPVVFLDEPTTGMDPKARRFLWNCALSVVKEGRSVVLTSHSMEECEALCTRMAIMVNGR
2070 2080 2090 2100 2110 2120
2150 2160 2170 2180 2190 2200
pF1KSD FRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQ
:::.:..::::..::::: ....: . . :::.::..:: ::::: .:.: ::::
CCDS67 FRCLGSVQHLKNRFGDGYTIVVRIAGSN----PDLKPVQDFFGLAFPGSVLKEKHRNMLQ
2130 2140 2150 2160 2170
2210 2220 2230 2240 2250 2260
pF1KSD FQVSSS--SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTES-H--DLPLHP
.:. :: ::::::..: . : : ::.:::.:::::::::::::.:... : :: ::
CCDS67 YQLPSSLSSLARIFSILSQSKKRLHIEDYSVSQTTLDQVFVNFAKDQSDDDHLKDLSLHK
2180 2190 2200 2210 2220 2230
2270
pF1KSD RAAGASRQAQD
CCDS67 NQTVVDVAVLTSFLQDEKVKESYV
2240 2250 2260
>>CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277 aa)
initn: 2534 init1: 779 opt: 1862 Z-score: 1630.9 bits: 315.7 E(32554): 1.6e-84
Smith-Waterman score: 3882; 34.7% identity (66.0% similar) in 1969 aa overlap (343-2273:434-2272)
320 330 340 350 360 370
pF1KSD TKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPI--YSYDRRTTSFC
:. : :: :... :. .: ::
CCDS33 FSTISQALCSQGITTEYLTAMLPSSQRPKGNHTKDFLTYKLTKEQIASKYGIPINSTPFC
410 420 430 440 450 460
380 390 400 410 420 430
pF1KSD NALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEELEHVRKLVKA
.: ... . : . : ::.:.:.:::.: .:... :....: :...: ..:. .
CCDS33 FSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELREKSQE
470 480 490 500 510 520
440 450 460 470 480
pF1KSD WEEVGPQIWYFFDNSTQ-MNMIRDTLGNPTVKDFLNRQLGEEGITAEAILNFLYKGPRES
: . .: . : .: . :...:: :: :. :.. ..: ... : : :
CCDS33 WMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFVKFSVGLDAVE-------LLKQIDEL
530 540 550 560 570
490 500 510 520 530 540
pF1KSD QADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALSLLEENMFWA
. . . ::.. . :. . :.. :.... . .. ..: : . : ...
CCDS33 DILRLKLENNIDIIDQLNTLSSLTVNISSCVLYDRIQAAKTIDEMEREAKRLYKSNELFG
580 590 600 610 620 630
550 560 570 580 590 600
pF1KSD GVVF--PDMYPWTSS-------LPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED
.:.: :. : . ::: .:: :::.. ... : ... . : ::. .: ..
CCDS33 SVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGPHNSPSHN
640 650 660 670 680 690
610 620 630 640 650
pF1KSD FRYIWG-GFAYLQDMVEQGITRSQV-QAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIF
:.: .: :::: .:..: . :. . ... .: .:::::. :.:. .. .::
CCDS33 --QIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSYSLPIV
700 710 720 730 740 750
660 670 680 690 700 710
pF1KSD MVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIF
...::. .. ::..: ::.:::.: .: .::.. . .:...: ... ..: .: :.
CCDS33 LMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIVILIII
760 770 780 790 800 810
720 730 740 750 760 770
pF1KSD IMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHIL
. : :: .. :::::.. .: ..: . .:.:.::.....:: ...::. ..: :.
CCDS33 LKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAFFPFIV
820 830 840 850 860 870
780 790 800 810 820 830
pF1KSD CFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLL
. ..... :: .:::::.::.....:..:.::::.:::: :. .::.. : ::
CCDS33 LVTVENELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPVQDDTTSFGW
880 890 900 910 920 930
840 850 860 870 880 890
pF1KSD SMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCS-TREERA--LE
..: :. .: :.:::. .:::: :: :::: . ::: ::. .. :.. :
CCDS33 LCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEVKPEKSNGLM
940 950 960 970 980 990
900 910 920 930 940 950
pF1KSD KTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYE
:. . ..:. :: . .: .: : . :: .....::. .. ::: ::..:::
CCDS33 FTNIMMQNTNPSASPEYMFSSNIEPEPKDLTVGVALHGVTKIY--GSKVAVDNLNLNFYE
1000 1010 1020 1030 1040 1050
960 970 980 990 1000 1010
pF1KSD NQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILF
..::..:: ::::::::.:.::::. ..::..: :.::.:.: .::...:.: ::..::
CCDS33 GHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTVRKNMGVCMQHDVLF
1060 1070 1080 1090 1100 1110
1020 1030 1040 1050 1060 1070
pF1KSD HHLTVAEHMLFYAQLKGKSQEEAQL--EMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVA
.::. ::.:.:...: . :: :.. :.::::. .:.... :::::.::::..
CCDS33 SYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRVGTLSGGMKRKLSIS
1120 1130 1140 1150 1160 1170
1080 1090 1100 1110 1120 1130
pF1KSD IAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAII
::..: ..:::::::..:::: :::::::.. : ...::::.::::.:::..:.::::..
CCDS33 IALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHHLDEAEVLSDRIAFL
1180 1190 1200 1210 1220 1230
1140 1150 1160 1170 1180 1190
pF1KSD AQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVD
:: : : :.:..::. :: : .:::..: .: .....:
CCDS33 EQGGLRCCGSPFYLKEAFGDGYHLTLTKK----KSPNLNANAVC----------------
1240 1250 1260 1270
1200 1210 1220 1230 1240 1250
pF1KSD DLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFK-HRAYASLFRELEE
:. . .. :.::: : : :: ::...:: . : :: ::.: :..
CCDS33 ----------DTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDN
1280 1290 1300 1310 1320
1260 1270 1280 1290 1300 1310
pF1KSD TLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAG-
..::... .::::: .::.::..:..:... . .. :... .. .: . :
CCDS33 GMGDLNIGCYGISDTTVEEVFLNLTKESQKN------SAMSLEHLTQKK--IGNSNANGI
1330 1340 1350 1360 1370
1320 1330 1340 1350 1360 1370
pF1KSD QTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHK
.::.: .: : . . . : .:. : :.:....:.:.:::.:: :. :
CCDS33 STPDDLSVSSSNFT------DRDDKILTRGERLD-GFGLLLKKIMAILIKRFHHTRRNWK
1380 1390 1400 1410 1420
1380 1390 1400 1410 1420
pF1KSD DFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG--QQYTFFSMDEPGSEQFTV
..::..:: .:: :. :. . . :: . . : .:: .: .:.. .:..: .
CCDS33 GLIAQVILPIVFVTTAMGLGTLRNSSNSYPEIQISPSLYGTSEQTAFYANYHPSTE---A
1430 1440 1450 1460 1470 1480
1430 1440 1450 1460 1470 1480
pF1KSD LADVLLNKPGFGNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCR
:.... . ::. : ::. . : . :.: : : ::.. :
CCDS33 LVSAMWDFPGIDNMCLNTSDLQCLNKDSLEKWNT-SGEP-ITNF------------GVCS
1490 1500 1510 1520 1530
1490 1500 1510 1520 1530 1540
pF1KSD CSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSK
:: . :::. . ::.: :.... .:: . . ..:..: ..
CCDS33 CSEN-----VQECPKF--NYSPPHRRTYSSQVIYNLTGQRVENYLISTANEFV-------
1540 1550 1560 1570
1550 1560 1570 1580 1590 1600
pF1KSD FWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHL
..:::: :.: .:.: .:: :. ...: : .: .:
CCDS33 ----QKRYGGWSFG-----LPLT--------KDL-RF-DITGVPANRTLAK---------
1580 1590 1600
1610 1620 1630 1640 1650 1660
pF1KSD ETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLS
::.. .:.:.: ..:: .: .::... : . ..:: . :.: ...:
CCDS33 -------VWYDPEGYHSLPAYLNSLNNFLLRVNMSK-YDAARHGIIMYSHPYPGVQDQ--
1610 1620 1630 1640 1650
1670 1680 1690 1700 1710 1720
pF1KSD EITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFL
: ..... .: .::. .....: . :::: :...:. .:.:.:: :::.. : ::::::.
CCDS33 EQATISSLIDILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYWVTNFI
1660 1670 1680 1690 1700 1710
1730 1740 1750 1760 1770 1780
pF1KSD WDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPS
.:.. : : ... .::. :. :. : .:: :. ::::.:.:.. :: . :: .
CCDS33 YDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGLFHETG
1720 1730 1740 1750 1760 1770
1790 1800 1810 1820 1830 1840
pF1KSD TAYVALSCANLFIGINS----SAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGL
:... :.:::.:::: :.. :. . :. :: .. .:......::.::.: ::
CCDS33 MAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFCFGYGL
1780 1790 1800 1810 1820 1830
1850 1860 1870 1880 1890
pF1KSD IDLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQR------H
:.:. .:.: : .: :. . :. . .: . :.: .:...: : ::... .
CCDS33 IELSQQQSVLDFLKAYGVEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINESLIKKLR
1840 1850 1860 1870 1880 1890
1900 1910 1920 1930 1940 1950
pF1KSD FFLSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP--AVDR
.:. .. . ..: : :::.:: :: :. .:. . :...:. ::: : . ::.
CCDS33 LFFRKFNSSHVRETI-DEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIHKKIIAVNN
1900 1910 1920 1930 1940 1950
1960 1970 1980 1990 2000 2010
pF1KSD LCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM-GY
. .:. :::::::::::::::: ::::::: .::. . .:. . . :... ::
CCDS33 ISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSHSSLVGY
1960 1970 1980 1990 2000 2010
2020 2030 2040 2050 2060 2070
pF1KSD CPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNK
::: ::.:.:.: .::::.:::..:.: ..:..... .. : : . : .. : :.:
CCDS33 CPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSMCSYGTK
2020 2030 2040 2050 2060 2070
2080 2090 2100 2110 2120 2130
pF1KSD RKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEAL
::::::.:::: : ..:::::..::::...: ::..: ... .:.::::::::::::
CCDS33 RKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSMEECEAL
2080 2090 2100 2110 2120 2130
2140 2150 2160 2170 2180 2190
pF1KSD CTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGS
::::::::.: :.:.:..::.::.:: :. : ...:. : .. . .:.: .:: .
CCDS33 CTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNK----VTMETLTKFMQLHFPKT
2140 2150 2160 2170 2180 2190
2200 2210 2220 2230 2240 2250
pF1KSD VQRERHYNMLQFQV--SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTE
...: .::...: .....: ::.:: ..: .: : .. :.::::..::.::::.:
CCDS33 YLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQKS
2200 2210 2220 2230 2240 2250
2260 2270
pF1KSD SHDLPLHPRAAGASRQAQD
. ... : ..::
CCDS33 YETADTSSQGSTISVDSQDDQMES
2260 2270
>>CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595 aa)
initn: 2534 init1: 779 opt: 1862 Z-score: 1630.1 bits: 315.7 E(32554): 1.8e-84
Smith-Waterman score: 3882; 34.7% identity (66.0% similar) in 1969 aa overlap (343-2273:752-2590)
320 330 340 350 360 370
pF1KSD TKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPI--YSYDRRTTSFC
:. : :: :... :. .: ::
CCDS33 FSTISQALCSQGITTEYLTAMLPSSQRPKGNHTKDFLTYKLTKEQIASKYGIPINSTPFC
730 740 750 760 770 780
380 390 400 410 420 430
pF1KSD NALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEELEHVRKLVKA
.: ... . : . : ::.:.:.:::.: .:... :....: :...: ..:. .
CCDS33 FSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELREKSQE
790 800 810 820 830 840
440 450 460 470 480
pF1KSD WEEVGPQIWYFFDNSTQ-MNMIRDTLGNPTVKDFLNRQLGEEGITAEAILNFLYKGPRES
: . .: . : .: . :...:: :: :. :.. ..: ... : : :
CCDS33 WMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFVKFSVGLDAVE-------LLKQIDEL
850 860 870 880 890
490 500 510 520 530 540
pF1KSD QADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALSLLEENMFWA
. . . ::.. . :. . :.. :.... . .. ..: : . : ...
CCDS33 DILRLKLENNIDIIDQLNTLSSLTVNISSCVLYDRIQAAKTIDEMEREAKRLYKSNELFG
900 910 920 930 940 950
550 560 570 580 590 600
pF1KSD GVVF--PDMYPWTSS-------LPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVED
.:.: :. : . ::: .:: :::.. ... : ... . : ::. .: ..
CCDS33 SVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGPHNSPSHN
960 970 980 990 1000 1010
610 620 630 640 650
pF1KSD FRYIWG-GFAYLQDMVEQGITRSQV-QAEAPVGIYLQQMPYPCFVDDSFMIILNRCFPIF
:.: .: :::: .:..: . :. . ... .: .:::::. :.:. .. .::
CCDS33 --QIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSYSLPIV
1020 1030 1040 1050 1060 1070
660 670 680 690 700 710
pF1KSD MVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFLLTIF
...::. .. ::..: ::.:::.: .: .::.. . .:...: ... ..: .: :.
CCDS33 LMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIVILIII
1080 1090 1100 1110 1120 1130
720 730 740 750 760 770
pF1KSD IMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHIL
. : :: .. :::::.. .: ..: . .:.:.::.....:: ...::. ..: :.
CCDS33 LKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAFFPFIV
1140 1150 1160 1170 1180 1190
780 790 800 810 820 830
pF1KSD CFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLL
. ..... :: .:::::.::.....:..:.::::.:::: :. .::.. : ::
CCDS33 LVTVENELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPVQDDTTSFGW
1200 1210 1220 1230 1240 1250
840 850 860 870 880 890
pF1KSD SMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCS-TREERA--LE
..: :. .: :.:::. .:::: :: :::: . ::: ::. .. :.. :
CCDS33 LCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEVKPEKSNGLM
1260 1270 1280 1290 1300 1310
900 910 920 930 940 950
pF1KSD KTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAVDRLNITFYE
:. . ..:. :: . .: .: : . :: .....::. .. ::: ::..:::
CCDS33 FTNIMMQNTNPSASPEYMFSSNIEPEPKDLTVGVALHGVTKIY--GSKVAVDNLNLNFYE
1320 1330 1340 1350 1360 1370
960 970 980 990 1000 1010
pF1KSD NQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILF
..::..:: ::::::::.:.::::. ..::..: :.::.:.: .::...:.: ::..::
CCDS33 GHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTVRKNMGVCMQHDVLF
1380 1390 1400 1410 1420 1430
1020 1030 1040 1050 1060 1070
pF1KSD HHLTVAEHMLFYAQLKGKSQEEAQL--EMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVA
.::. ::.:.:...: . :: :.. :.::::. .:.... :::::.::::..
CCDS33 SYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRVGTLSGGMKRKLSIS
1440 1450 1460 1470 1480 1490
1080 1090 1100 1110 1120 1130
pF1KSD IAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAII
::..: ..:::::::..:::: :::::::.. : ...::::.::::.:::..:.::::..
CCDS33 IALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHHLDEAEVLSDRIAFL
1500 1510 1520 1530 1540 1550
1140 1150 1160 1170 1180 1190
pF1KSD AQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVD
:: : : :.:..::. :: : .:::..: .: .....:
CCDS33 EQGGLRCCGSPFYLKEAFGDGYHLTLTKK----KSPNLNANAVC----------------
1560 1570 1580 1590
1200 1210 1220 1230 1240 1250
pF1KSD DLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFK-HRAYASLFRELEE
:. . .. :.::: : : :: ::...:: . : :: ::.: :..
CCDS33 ----------DTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDN
1600 1610 1620 1630 1640
1260 1270 1280 1290 1300 1310
pF1KSD TLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAG-
..::... .::::: .::.::..:..:... . .. :... .. .: . :
CCDS33 GMGDLNIGCYGISDTTVEEVFLNLTKESQKN------SAMSLEHLTQKK--IGNSNANGI
1650 1660 1670 1680 1690
1320 1330 1340 1350 1360 1370
pF1KSD QTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHK
.::.: .: : . . . : .:. : :.:....:.:.:::.:: :. :
CCDS33 STPDDLSVSSSNFT------DRDDKILTRGERLD-GFGLLLKKIMAILIKRFHHTRRNWK
1700 1710 1720 1730 1740
1380 1390 1400 1410 1420
pF1KSD DFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG--QQYTFFSMDEPGSEQFTV
..::..:: .:: :. :. . . :: . . : .:: .: .:.. .:..: .
CCDS33 GLIAQVILPIVFVTTAMGLGTLRNSSNSYPEIQISPSLYGTSEQTAFYANYHPSTE---A
1750 1760 1770 1780 1790 1800
1430 1440 1450 1460 1470 1480
pF1KSD LADVLLNKPGFGNRCLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCR
:.... . ::. : ::. . : . :.: : : ::.. :
CCDS33 LVSAMWDFPGIDNMCLNTSDLQCLNKDSLEKWNT-SGEP-ITNF------------GVCS
1810 1820 1830 1840
1490 1500 1510 1520 1530 1540
pF1KSD CSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSK
:: . :::. . ::.: :.... .:: . . ..:..: ..
CCDS33 CSEN-----VQECPKF--NYSPPHRRTYSSQVIYNLTGQRVENYLISTANEFV-------
1850 1860 1870 1880 1890
1550 1560 1570 1580 1590 1600
pF1KSD FWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHL
..:::: :.: .:.: .:: :. ...: : .: .:
CCDS33 ----QKRYGGWSFG-----LPLT--------KDL-RF-DITGVPANRTLAK---------
1900 1910 1920
1610 1620 1630 1640 1650 1660
pF1KSD ETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLS
::.. .:.:.: ..:: .: .::... : . ..:: . :.: ...:
CCDS33 -------VWYDPEGYHSLPAYLNSLNNFLLRVNMSK-YDAARHGIIMYSHPYPGVQDQ--
1930 1940 1950 1960 1970
1670 1680 1690 1700 1710 1720
pF1KSD EITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFL
: ..... .: .::. .....: . :::: :...:. .:.:.:: :::.. : ::::::.
CCDS33 EQATISSLIDILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYWVTNFI
1980 1990 2000 2010 2020 2030
1730 1740 1750 1760 1770 1780
pF1KSD WDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPS
.:.. : : ... .::. :. :. : .:: :. ::::.:.:.. :: . :: .
CCDS33 YDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGLFHETG
2040 2050 2060 2070 2080 2090
1790 1800 1810 1820 1830 1840
pF1KSD TAYVALSCANLFIGINS----SAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGL
:... :.:::.:::: :.. :. . :. :: .. .:......::.::.: ::
CCDS33 MAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFCFGYGL
2100 2110 2120 2130 2140 2150
1850 1860 1870 1880 1890
pF1KSD IDLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQR------H
:.:. .:.: : .: :. . :. . .: . :.: .:...: : ::... .
CCDS33 IELSQQQSVLDFLKAYGVEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINESLIKKLR
2160 2170 2180 2190 2200 2210
1900 1910 1920 1930 1940 1950
pF1KSD FFLSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP--AVDR
.:. .. . ..: : :::.:: :: :. .:. . :...:. ::: : . ::.
CCDS33 LFFRKFNSSHVRETI-DEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIHKKIIAVNN
2220 2230 2240 2250 2260 2270
1960 1970 1980 1990 2000 2010
pF1KSD LCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM-GY
. .:. :::::::::::::::: ::::::: .::. . .:. . . :... ::
CCDS33 ISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSHSSLVGY
2280 2290 2300 2310 2320 2330
2020 2030 2040 2050 2060 2070
pF1KSD CPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNK
::: ::.:.:.: .::::.:::..:.: ..:..... .. : : . : .. : :.:
CCDS33 CPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSMCSYGTK
2340 2350 2360 2370 2380 2390
2080 2090 2100 2110 2120 2130
pF1KSD RKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEAL
::::::.:::: : ..:::::..::::...: ::..: ... .:.::::::::::::
CCDS33 RKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSMEECEAL
2400 2410 2420 2430 2440 2450
2140 2150 2160 2170 2180 2190
pF1KSD CTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGS
::::::::.: :.:.:..::.::.:: :. : ...:. : .. . .:.: .:: .
CCDS33 CTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNK----VTMETLTKFMQLHFPKT
2460 2470 2480 2490 2500 2510
2200 2210 2220 2230 2240 2250
pF1KSD VQRERHYNMLQFQV--SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTE
...: .::...: .....: ::.:: ..: .: : .. :.::::..::.::::.:
CCDS33 YLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQKS
2520 2530 2540 2550 2560 2570
2260 2270
pF1KSD SHDLPLHPRAAGASRQAQD
. ... : ..::
CCDS33 YETADTSSQGSTISVDSQDDQMES
2580 2590
>>CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058 aa)
initn: 2349 init1: 673 opt: 1297 Z-score: 1130.1 bits: 224.1 E(32554): 1.3e-56
Smith-Waterman score: 3634; 33.6% identity (62.5% similar) in 2197 aa overlap (110-2262:3036-5046)
80 90 100 110 120 130
pF1KSD PCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQHLGRIWTELHILSQFMDTL
:.: : : . : . :. . . :....
CCDS47 LSSTLESFKSSLENATGQDCTSQPRLETVQQHLYMLA---KSLEETWSSGNPIMTFLSNF
3010 3020 3030 3040 3050 3060
140 150 160 170 180 190
pF1KSD RTHPERIAGRGIRIRDILKDEETLTLFLIKNIGLSDSVVYLLINSQVRPEQFAHGVPDLA
. . ..:.:..:. :: : ..: .:. ... ...... . .. .:
CCDS47 TVTED------VKIKDLMKNITKLTEELRSSIQISNETIHSILEANISHSKVLFSALTVA
3070 3080 3090 3100 3110
200 210 220 230 240 250
pF1KSD LKDIACSEALLERFIIFSQRRGAKTVRYALCSLSQGTLQWIEDTLYANVDFFKLFRVLPT
:. :.. .:. .. : . . . . :::: . . . : :.: . : . :
CCDS47 LSG-KCDQEILHLLLTFPKGEKSWIAAEELCSLPGSKVYSLIVLLSRNLDV-RAF-IYKT
3120 3130 3140 3150 3160 3170
260 270 280 290 300
pF1KSD LLDSRSQGINLRSWGGILSDMSP----------RIQEFIHRPSMQDLLWVT--RPLMQNG
:. :...:. : : :.:..: . ::.: .. :: . . . ::
CCDS47 LMPSEANGL-LNSLLDIVSSLSALLAKAQHVFEYLPEFLHTFKITALLETLDFQQVSQNV
3180 3190 3200 3210 3220 3230
310 320 330 340 350 360
pF1KSD GPET--FTKLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGIDSTRKDPIYSYDRR
.. : ... ... ..: . .: . . : . . : :. .: .. .
CCDS47 QARSSAFGSFQFVMK-MVC---KDQASFLSDSNMFINLPRVKELLEDDKEK---FNIPED
3240 3250 3260 3270 3280
370 380 390 400 410 420
pF1KSD TTSFCNALIQSLESNPLTKIAWRAAKPLLMGKILYTPDSPAARRILKNANSTFEELEHVR
.: :: : : . . : ..: ::.: :::::::..: .....:: :: .....
CCDS47 STPFCLKLYQEILQLPNGALVWTFLKPILHGKILYTPNTPEINKVIQKANYTFYIVDKLK
3290 3300 3310 3320 3330 3340
430 440 450 460 470 480
pF1KSD KLVKAWEEVGPQIWYFFDNSTQM-NMIRDTLGNPTVKDFLNRQLGEEGITAEAILNFL--
: .. :.. . ..: :: :.....: : :..:.. :: : .. . . :
CCDS47 TLSETLLEMSSLFQR--SGSGQMFNQLQEALRNKFVRNFVENQLH---IDVDKLTEKLQT
3350 3360 3370 3380 3390 3400
490 500 510 520 530 540
pF1KSD YKGPRESQADDMANFDWRDIFNITDRTLRLVNQYLECLVLDKFESYNDETQLTQRALSLL
: : :.: : : . : :: :..:..:.. .. : .: ::
CCDS47 YGG----LLDEMFNHAGAGRFRFLGSIL--VNLS-SCVALNRFQALQSVDILETKAHELL
3410 3420 3430 3440 3450
550 560 570 580 590
pF1KSD EENMFWAGVVFPD------MYPWTSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRAD
..: : :...: . . . .:::::.: :: .. .:. .:. : :.
CCDS47 QQNSFLASIIFSNSLFDKNFRSESVKLPPHVSYTIRTNVLYSVRTDVVKNPSWKFHPQNL
3460 3470 3480 3490 3500 3510
600 610 620 630 640 650
pF1KSD PVEDFRYIWGGFAYLQDMVEQGITRSQVQAEA--PVGIYLQQMPYPCFVDDSFMIILNRC
:.. :.: . :: ::::.:..: :. :: :.. : :::: ..: :. ..
CCDS47 PADGFKYNYV-FAPLQDMIERAIILVQTGQEALEPAA-QTQAAPYPCHTSDLFLNNVGFF
3520 3530 3540 3550 3560 3570
660 670 680 690 700 710
pF1KSD FPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSIFL
::..:.:.:. ::. :...: :.:....: .. .:: .. . .:::........:
CCDS47 FPLIMMLTWMVSVASMVRKLVYEQEIQIEEYMRMMGVHPVIHFLAWFLENMAVLTISSAT
3580 3590 3600 3610 3620 3630
720 730 740 750 760 770
pF1KSD LTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYL
:.: . . :. .:. ::.::::: :. ...:: .:::.:::.:. :: :....:. .:
CCDS47 LAIVLKTSGIFAHSNTFIVFLFLLDFGMSVVMLSYLLSAFFSQANTAALCTSLVYMISFL
3640 3650 3660 3670 3680 3690
780 790 800 810 820 830
pF1KSD PHILCFAWQDRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEF
:.:. .. ..... . . ::: .::: :. ... .: : :.::.:. .. .: .
CCDS47 PYIVLLVLHNQLSFVNQTFLCLLSTTAFGQGVFFITFLEGQETGIQWNNMYQALEQGG-M
3700 3710 3720 3730 3740 3750
840 850 860 870 880 890
pF1KSD SFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERAL
.: :.:.:...: : .:::....:: .: :::: . ::: . ... :
CCDS47 TFGWVCWMILFDSSLYFLCGWYLSNLIPGTFGLRKPWYFPFTASYWKSVGFLVEKRQYFL
3760 3770 3780 3790 3800 3810
900 910 920 930 940 950
pF1KSD EKTEPLTEETEDPEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQPAV-DRLNITF
.. . .:. : . : . : : : .::: . ...: .: :. :: . :..::
CCDS47 SSSLFFFNENFDNK---GSSLQNREGELEGSAPGVTLVSVTKEYE--GHKAVVQDLSLTF
3820 3830 3840 3850 3860
960 970 980 990 1000 1010
pF1KSD YENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNI
:..::::.:: ::::::: .:.:::: ::::::....:....:.:. ::. ::.:::..:
CCDS47 YRDQITALLGTNGAGKTTIISMLTGLHPPTSGTIIINGKNLQTDLSRVRMELGVCPQQDI
3870 3880 3890 3900 3910 3920
1020 1030 1040 1050 1060 1070
pF1KSD LFHHLTVAEHMLFYAQLKGK--SQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLS
:. .::: ::.:..:..:. ...: . ... :.:. : ........ ::::..::::
CCDS47 LLDNLTVREHLLLFASIKAPQWTKKELHQQVNQTLQDVDLTQHQHKQTRALSGGLKRKLS
3930 3940 3950 3960 3970 3980
1080 1090 1100 1110 1120 1130
pF1KSD VAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIA
..:::.: ...:.:::::::::: ::.:.::.::::: :::::..:::.:::. :.::.:
CCDS47 LGIAFMGMSRTVVLDEPTSGVDPCSRHSLWDILLKYREGRTIIFTTHHLDEAEALSDRVA
3990 4000 4010 4020 4030 4040
1140 1150 1160 1170 1180 1190
pF1KSD IIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAH
.. .::: : : :. ::. .: :: :::.:. .. ::
CCDS47 VLQHGRLRCCGPPFCLKEAYGQGLRLTLTRQ----------------------PSVLEAH
4050 4060 4070 4080
1200 1210 1220 1230 1240 1250
pF1KSD VDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELE
:: :. . ... ..:.: : . :.:: . .: :. . .::. :.
CCDS47 --DLK-------DMACVTSLIKIYIPQAFLKDSSGSELTYTIP-KDTDKACLKGLFQALD
4090 4100 4110 4120 4130
1260 1270 1280 1290 1300 1310
pF1KSD ETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAG
:.: .: :...::::: :::.:: . .::.. .: :.... .: :
CCDS47 ENLHQLHLTGYGISDTTLEEVFLMLLQDSNKKSHIALGTESELQNHRP------------
4140 4150 4160 4170 4180
1320 1330 1340 1350 1360 1370
pF1KSD QTPQDSNVCSPGAPAAHPEGQPPPEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHK
: . :. : :. : : :.::. .: :.:..:...:.:. :
CCDS47 -TGHLSGYC--GSLAR--------------PATVQGVQLLRAQVAAILARRLRRTLRAGK
4190 4200 4210 4220
1380 1390 1400 1410 1420 1430
pF1KSD DFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLA
. ::...::. :: ::. : .: : ::: : : : : . :.: . :.... :.
CCDS47 STLADLLLPVLFVALAMGLFMVRPLATEYPPLRLTPGHYQRAETYFFSS--GGDNLD-LT
4230 4240 4250 4260 4270 4280
1440 1450 1460 1470 1480
pF1KSD DVLLNKPGFGNRCLKEGWL-PEYPCGNSTPWKT-PSVSPNITQLFQKQKWTQVNPSPSCR
::: : : .. : . : :. ::. :.: : :. :: ::
CCDS47 RVLLRK--FRDQDLPCADLNPRQK--NSSCWRTDPFSHPE----FQD----------SCG
4290 4300 4310 4320
1490 1500 1510 1520 1530 1540
pF1KSD CSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSK
: .::. ... : :.. . : .:. :. ..:. :.
CCDS47 CL---------KCPNRSAS--APYLTNHLGHTLLNLSGFNMEEYLLA--PS---------
4330 4340 4350 4360
1550 1560 1570 1580 1590 1600
pF1KSD FWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHL
.. : :: :.: :.: .:: : : :.: :
CCDS47 ---EKPRLGGWSFGLKIP-----SEA--G-----GANGNISKPPTL--------------
4370 4380 4390
1610 1620 1630 1640 1650 1660
pF1KSD ETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLS
:::.:.::.:.: :.:: .: :: :: . ..::::. :.: . :.
CCDS47 -----AKVWYNQKGFHSLPSYLNHLNNLILWQHLPPTVDWRQYGITLYSHPYG--GALLN
4400 4410 4420 4430 4440
1670 1680 1690 1700 1710 1720
pF1KSD EITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFL
: .: . . ::.:.....:.. ::. ....:: .:.:: :::.. :: ::::
CCDS47 EDKILESIRQCGVALCIVLGFSILSASIGSSVVRDRVIGAKRLQHISGLGYRMYWFTNFL
4450 4460 4470 4480 4490 4500
1730 1740 1750 1760 1770 1780
pF1KSD WDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPS
.:.. : ::. : :.....:: :.: .:: : . :: :.:.:..: :: : .:. .
CCDS47 YDMLFYLVSVCLCVAVIVAFQLTAFTFRKNLAATALLLSLFGYATLPWMYLMSRIFSSSD
4510 4520 4530 4540 4550 4560
1790 1800 1810 1820 1830 1840
pF1KSD TAYVALSCANLFIGINSSAITFI---LELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLI
.:... :...:. . ::.. : .. . ..: . ::. .. .::.::::.::.
CCDS47 VAFISYVSLNFIFGLCTMLITIMPRLLAIISKAKNLQNIYDVLKWVFTIFPQFCLGQGLV
4570 4580 4590 4600 4610 4620
1850 1860 1870 1880 1890 1900
pF1KSD DLALSQAVTDVYARFGEEHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWI
.: .: :. :: . ..::. ...: . .. .:.: .:: .:. :. : .:
CCDS47 ELCYNQIKYDLTHNFGIDSYVSPFEMNFLGWIFVQLASQGTVLLLLRVLL--HWDLLRWP
4630 4640 4650 4660 4670 4680
1910 1920 1930 1940 1950 1960
pF1KSD -AEPTKEPIV--DEDDDVAEERQRIITGGNKTDILRLHELTKIYPG--TSSPAVDRLCVG
.. : . : ..: :: .:..:.. : .. ::: :..:.: : . ::. . .:
CCDS47 RGHSTLQGTVKSSKDTDVEKEEKRVFEGRTNGDILVLYNLSKHYRRFFQNIIAVQDISLG
4690 4700 4710 4720 4730 4740
1970 1980 1990 2000 2010
pF1KSD VRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATV---AGKSI-LTNISEVHQNMGYC
. ::::::::::::::.::::::.:....::: : . : .. :.. . . .:::
CCDS47 IPKGECFGLLGVNGAGKSTTFKMLNGEVSLTSGHAIIRTPMGDAVDLSSAGTAGVLIGYC
4750 4760 4770 4780 4790 4800
2020 2030 2040 2050 2060 2070
pF1KSD PQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKR
:: ::.:::::: :::: : :::.: . : .::. :. : : ..:: ..:::::.::
CCDS47 PQQDALDELLTGWEHLYYYCSLRGIPRQCIPEVAGDLIRRLHLEAHADKPVATYSGGTKR
4810 4820 4830 4840 4850 4860
2080 2090 2100 2110 2120 2130
pF1KSD KLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALC
:::::.::.: : ..:::::..:::: ..:.::..:.. .::: :.::::::::::::::
CCDS47 KLSTALALVGKPDILLLDEPSSGMDPCSKRYLWQTIMKEVREGCAAVLTSHSMEECEALC
4870 4880 4890 4900 4910 4920
2140 2150 2160 2170 2180 2190
pF1KSD TRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSV
:::::::.:.:.:.:. ::.:..::::: : . . . .. : . .. :::
CCDS47 TRLAIMVNGSFKCLGSPQHIKNRFGDGYTVKVWLCKEANQ----HCTVSDHLKLYFPGIQ
4930 4940 4950 4960 4970
2200 2210 2220 2230 2240 2250
pF1KSD QRERHYNMLQFQVSS--SSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTES
. .: :.:...: . . :: .:... ..: : :..::..::::.:::.:::..: ..
CCDS47 FKGQHLNLLEYHVPKRWGCLADLFKVIENNKTFLNIKHYSINQTTLEQVFINFASEQQQT
4980 4990 5000 5010 5020 5030
2260 2270
pF1KSD HDLPLHPRAAGASRQAQD
. : :
CCDS47 LQSTLDPSTDSHHTHHLPI
5040 5050
>>CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704 aa)
initn: 3017 init1: 963 opt: 1130 Z-score: 990.2 bits: 196.7 E(32554): 7.8e-49
Smith-Waterman score: 3094; 35.1% identity (62.1% similar) in 1710 aa overlap (590-2252:190-1696)
560 570 580 590 600 610
pF1KSD TSSLPPHVKYKIRMDIDVVEKTNKIKDRYWDSGPRADPVEDFR---YIWGGFAYLQDMVE
. ::: : :: :: .: :.
CCDS10 RRNYMWTQTGSFFLKETEGWHTTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVD
160 170 180 190 200 210
620 630 640 650 660 670
pF1KSD QGITRSQVQAEAP-----VGIYLQQMPYPCFVDDSFMIILNRCFPIFMVLAWIYSVSMTV
..: . ...: . . . ....::: :. : :.. .. .:....:.. :.. .
CCDS10 RAIMEYHADAATRQLFQRLTVTIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIA
220 230 240 250 260 270
680 690 700 710 720
pF1KSD KSIVLEKELRLKETLKNQGVSNAVIWCTWFLDSFSIMSMSI-FLLTIFIMHGR----ILH
...: ::: :::: .. .:.:. . : .::: : .. .. :. .: .. . .:
CCDS10 RAVVQEKERRLKEYMRMMGLSSWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLS
280 290 300 310 320 330
730 740 750 760 770 780
pF1KSD YSDPFILFLFLLAFSTATIMLCFLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQDRM
::: ... ::: :. .:: . :..:::::::..::: .: .:: :.:... . :
CCDS10 RSDPSLVLAFLLCFAISTISFSFMVSTFFSKANMAAAFGGFLYFFTYIPYFFVAPRYNWM
340 350 360 370 380 390
790 800 810 820 830 840
pF1KSD TAELKKAVSLLSPVAFGFGTEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLD
: : ::: ::...:.. . .:: .:.:.:: .. . . :.: : . :.:::
CCDS10 TLSQKLCSCLLSNVAMAMGAQLIGKFEAKGMGIQWRDLLSPVNVDDDFCFGQVLGMLLLD
400 410 420 430 440 450
850 860 870 880 890 900
pF1KSD AAVYGLLAWYLDQVFPGDYGTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETED
...:::..::.. ::::..:.: ::::... ::: : . ::. : :: :
CCDS10 SVLYGLVTWYMEAVFPGQFGVPQPWYFFIMPSYWCG-------KPRAVAGKE---EEDSD
460 470 480 490 500
910 920 930 940 950 960
pF1KSD PEHPEGIHDSFFEREHPGWVPGVCVKNLVKIFEPCGQP--AVDRLNITFYENQITAFLGH
:: ..... .:: : : :. .:.: :.:. .. :: ::...::.:::..:::
CCDS10 PE--KALRNEYFEAEPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGH
510 520 530 540 550 560
970 980 990 1000 1010 1020
pF1KSD NGAGKTTTLSILTGLLPPTSGTVLVGGRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHM
::::::::::.::::.::::: . ..: .: .. .:.:::.::::.::: .::::::.
CCDS10 NGAGKTTTLSMLTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHL
570 580 590 600 610 620
1030 1040 1050 1060 1070 1080
pF1KSD LFYAQLKGKSQEEAQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVI
::::::: :... :.. ::. ::. : : ... :::::.::::..::... .::.:
CCDS10 YFYAQLKGLSRQKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLI
630 640 650 660 670 680
1090 1100 1110 1120 1130 1140
pF1KSD LDEPTSGVDPYSRRSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTP
:::::::.: :::.::::: . .: :::...:: :::::::::::::.:.:.: : :.
CCDS10 LDEPTSGMDAISRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSS
690 700 710 720 730 740
1150 1160 1170 1180 1190 1200
pF1KSD LFLKNCFGTGLYLTLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGD
::::. .:.: ..:::. : :. :: :
CCDS10 LFLKQKYGAGYHMTLVK------------EPHCN------------------PE-----D
750 760 770
1210 1220 1230 1240 1250 1260
pF1KSD VNELMDVVLHHVPEAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGI
...: : ::::.: : : :: :.:: .. :: . .:: .::. .::..:::
CCDS10 ISQL---VHHHVPNATLESSAGAELSFILPRES-THR-FEGLFAKLEKKQKELGIASFGA
780 790 800 810 820
1270 1280 1290 1300 1310 1320
pF1KSD SDTPLEEIFLKVTEDSDSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGA
: : .::.::.: . ::. . . : .. .: ...:.. :::.:.
CCDS10 SITTMEEVFLRVGKLVDSS-MDIQAIQLP--ALQYQH-----ERRASDWAVDSNLCGAMD
830 840 850 860 870
1330 1340 1350 1360 1370 1380
pF1KSD PAAHPEGQPP-PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQIVLPATF
:. .: : : . .:::: : :. :...:. .. : : ::...: :
CCDS10 PS---DGIGALIEEERTAVKLNTGLALHCQQFWAMFLKKAAYSWREWKMVAAQVLVPLTC
880 890 900 910 920 930
1390 1400 1410 1420 1430 1440
pF1KSD VFLALMLSIVIPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLLNKPGFGNR
: :::. . . : : : ::. . ::. ::. :. :..
CCDS10 VTLALLAINYSSELFDDPMLRLTLGEYGRTVVPFSV--PGTSQL-------------GQQ
940 950 960 970 980
1450 1460 1470 1480 1490 1500
pF1KSD CLKEGWLPEYPCGNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECP
.: .. . .: . . : . :.. ..
CCDS10 ----------------------LSEHLKDALQAE-----GQEPREVLGDLEEFLIFRASV
990 1000 1010
1510 1520 1530 1540 1550 1560
pF1KSD EGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIG
:: ::. .: .. ..:. .:.. . : :.: : .
CCDS10 EG-GGF--NERCLVAAS-FRDVGERTVVNALF-----------------NNQAYHS----
1020 1030 1040
1570 1580 1590 1600 1610 1620
pF1KSD GKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKG
: :. :.: ::.
CCDS10 ------PATALAVV-----------------------------------DNL--------
1050 1060
1630 1640 1650 1660 1670 1680
pF1KSD WHALVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVA
: ..: : .:. ...:. :: :. .:.:..: . : .:
CCDS10 ---LFKLLCGPHASIVVSNFPQPRSA-----------LQAAKDQFNEGR---KGFD--IA
1070 1080 1090 1100
1690 1700 1710 1720 1730 1740
pF1KSD ICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVV
. ..:.:.:. ..: . ..::. ..::.::.::: ...:.. .:::.... . . :..
CCDS10 LNLLFAMAFLASTFSILAVSERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLL
1110 1120 1130 1140 1150 1160
1750 1760 1770 1780 1790 1800
pF1KSD GIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIG
.: .:. .:.: .. . ::::::::.::.:: .:.: .:::. :. :.. :
CCDS10 VVFKAFDVRAFTRDGHMADTLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSG
1170 1180 1190 1200 1210 1220
1810 1820 1830 1840 1850
pF1KSD INSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDL---------ALSQAV
: . .. :... : ... .: ....:.:. ::: .. .. :. :
CCDS10 IATFLMVTIMRI--PAVKLEELSKTLDHVFLVLPNHCLGMAVSSFYENYETRRYCTSSEV
1230 1240 1250 1260 1270
1860 1870 1880 1890 1900
pF1KSD TDVYAR-FGEEHSANPFHWDL--IGKNLFAMVVEGVVYFLLTLLVQRHFFLS--------
. : . .. ... : . :. .:. . .:.. : .:..: .:.. ...
CCDS10 AAHYCKKYNIQYQENFYAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCAL
1280 1290 1300 1310 1320 1330
1910 1920 1930 1940 1950
pF1KSD ---QWIAE-PTKEPIVDEDDDVAEERQRIITGGNKTDI---LRLHELTKIYPGTSSP--A
. ..: :. :.. ::.:::.:: ::.. . . . : ..::.:.: : :
CCDS10 RRRRTLTELYTRMPVLPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYE-QRVPLLA
1340 1350 1360 1370 1380 1390
1960 1970 1980 1990 2000 2010
pF1KSD VDRLCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNM
:::: ..:. :::::::: ::::::::::::::. ..::::: :.:. : .....:.: .
CCDS10 VDRLSLAVQKGECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRI
1400 1410 1420 1430 1440 1450
2020 2030 2040 2050 2060 2070
pF1KSD GYCPQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGG
::::::::. . .:::: : .::::::.: ..: .. ....: : .:. :. :::::
CCDS10 GYCPQFDALLDHMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGG
1460 1470 1480 1490 1500 1510
2080 2090 2100 2110 2120 2130
pF1KSD NKRKLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECE
:::::::.::::: : ...::::.::::: :::.::.... . :.:...:::::::::
CCDS10 NKRKLSTGIALIGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECE
1520 1530 1540 1550 1560 1570
2140 2150 2160 2170 2180 2190
pF1KSD ALCTRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFP
::::::::::.: :.:.:. ::::::::.:: . :..: .. :. . : . .::
CCDS10 ALCTRLAIMVQGQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQ--EALEEFKAFVDLTFP
1580 1590 1600 1610 1620 1630
2200 2210 2220 2230 2240 2250
pF1KSD GSVQRERHYNMLQFQVSSSSL--ARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQ
::: ...: .:..... . .: :..: .: . :.. ...:::.: .:.:::..::. :
CCDS10 GSVLEDEHQGMVHYHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQ
1640 1650 1660 1670 1680 1690
2260 2270
pF1KSD TESHDLPLHPRAAGASRQAQD
CCDS10 PPTAEEGR
1700
>>CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616 aa)
initn: 1279 init1: 488 opt: 753 Z-score: 659.6 bits: 135.4 E(32554): 2e-30
Smith-Waterman score: 1462; 26.9% identity (54.6% similar) in 1695 aa overlap (605-2252:173-1593)
580 590 600 610 620 630
pF1KSD IDVVEKTNKIKDRYWDSGPRADPVEDFRYIWG-GFAYLQDMVEQGI---TRSQVQAEAPV
: ::. :: .. .: : .. : .
CCDS74 HGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVMEELM
150 160 170 180 190 200
640 650 660 670 680
pF1KSD GIYLQQMPYPCFVDDSFMIILNRCFPIFMVLA-WIYSVSMTVKSIVLEKELRLKETLKNQ
.. ..: . :. .: .: : .. .. .:: .:..: :.. :.: . .
CCDS74 SVTGKNMKMHSFIGQSGVITDLYLFSCIISFSSFIYYASVNVTR---ERK-RMKALMTMM
210 220 230 240 250
690 700 710 720 730 740
pF1KSD GVSNAVIWCTW-FLDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLC
:. ....: .: .: . :. :..:: .. : ... : ...: ..: .. . . :
CCDS74 GLRDSAFWLSWGLLYAGFIFIMALFL-ALVIRSTQFIILSGFMVVFSLFLLYGLSLVALA
260 270 280 290 300 310
750 760 770 780 790 800
pF1KSD FLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQD---RMTAELKKAVSLLSPVAFGFG
::.: . .:. : .:.. : : . :... . .. : :. .::::: :: .:
CCDS74 FLMSILVKKSFL----TGLVVFLLTV-FWGCLGFTSLYRHLPASLEWILSLLSPFAFMLG
320 330 340 350 360 370
810 820 830 840 850 860
pF1KSD TEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDY
:.... :. :: :..:... .. . :. .:. .: :: :.....:..:
CCDS74 MAQLLHLD---YDLN-SNAFPHPSDGSNL-IVATNFMLAFDTCLYLALAIYFEKILPNEY
380 390 400 410 420
870 880 890 900 910 920
pF1KSD GTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFEREHPGW
: : :.:. :.: .::. .. : : : ..:::: :. : .
CCDS74 GHRRPPLFFLKSSFW-----------SQTQKTDHVALEDEMDADP-SFHDSF-EQAPPEF
430 440 450 460 470
930 940 950 960 970
pF1KSD V--PGVCVKNLVKIFEPCGQP----AVDRLNITFYENQITAFLGHNGAGKTTTLSILTGL
.. ..:..: .. :.: :. : . .::.::::.:::.::::.: :.::.::
CCDS74 QGKEAIRIRNVTKEYK--GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGL
480 490 500 510 520 530
980 990 1000 1010 1020 1030
pF1KSD LPPTSGTVLVGGRDIE--TSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEE
::.:.: . . . ..:. . . :.::: :. : ::: :.. ..:..:: .:
CCDS74 SVPTKGSVTIYNNKLSEMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQE
540 550 560 570 580 590
1040 1050 1060 1070 1080 1090
pF1KSD AQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSR
.. :.. .: . ... .. ::.::::..:::. .::..:: .. .:::::.:.::.::
CCDS74 VDKEIQRVLLELEMKNIQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSR
600 610 620 630 640 650
1100 1110 1120 1130 1140 1150
pF1KSD RSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYL
...:.:: . .. :.:..::. :::::.:.:: ....::.: :.:. ::::. .: : .:
CCDS74 HQVWNLLKERKTDRVILFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHL
660 670 680 690 700 710
1160 1170 1180 1190 1200 1210
pF1KSD TLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVP
.: ....: : ..... .: .:.:
CCDS74 SL--QLNEI------------CVEENITS------------------------LVKQHIP
720 730
1220 1230 1240 1250 1260 1270
pF1KSD EAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVT
.::: .::. :: . . . :...:. . :::. ..:.: : :.:.:::.
CCDS74 DAKLSAKSEGKLIYTLPLE--RTNKFPELYKDLD-SYPDLGIENYGVSMTTLNEVFLKLE
740 750 760 770 780 790
1280 1290 1300 1310 1320 1330
pF1KSD EDS---DSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGAPAAHPEGQPP
: .: . : .: .. . . : : :. : : . :
CCDS74 GKSTINESDIAILGEVQAEKADDTER---LVEMEQ---------VLSSLNKMRKTIG---
800 810 820 830
1340 1350 1360 1370 1380 1390
pF1KSD PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQI-VLPATFVFLALMLSIV
:. : :.. :. :. . . .: .:: . .: : : : . ..:
CCDS74 ------------GVALWRQQICAIARVRLLKLKHERKALLALLLILMAGFCPLLVEYTMV
840 850 860 870 880
1400 1410 1420 1430 1440
pF1KSD IPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLL-NKPG-----FGNRCLKE
. : . : : .: :.. ::.. :...:. :: : : . ..
CCDS74 KIYQNSY-TWELSPHLY-----FLA---PGQQPHDPLTQLLIINKTGASIDDFIQSVEHQ
890 900 910 920 930
1450 1460 1470 1480 1490 1500
pF1KSD GWLPEYPC-GNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECPEGA
. : :. . :: . :: ... : : : :... .:. .:
CCDS74 NIALEVDAFGTRNGTDDPSYNGAITVCCNEK-----NYSFSLACNAK-RLNCFP------
940 950 960 970 980
1510 1520 1530 1540 1550 1560
pF1KSD GGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIGGKL
.:.:... .. .:: :.. . .: : : :
CCDS74 --------------VLMDIVSNGLLG-MVK--PSVHIRTERSTFLENGQDN---------
990 1000 1010
1570 1580 1590 1600 1610 1620
pF1KSD PVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKGWHA
:: :::. . . .... : . : :. .. ... :. . : .
CCDS74 ---PI------GFLAYIMFWLVLTSSCPPYIAMSSIDDYKNRARSQLRISGLSPSAYWFG
1020 1030 1040 1050 1060
1630 1640 1650 1660 1670 1680
pF1KSD LVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVAICV
....:. .. . . : .. ::. .. : : . . :.
CCDS74 Q-ALVDVSLYFLVFVFI--------YLMSYISNFEDM----------LLTIIHIIQIPCA
1070 1080 1090 1100
1690 1700 1710 1720 1730 1740
pF1KSD I-FSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVVGI
. .:.:.. ..:. .: .. :. ::. : : . . .:: ::.. .:
CCDS74 VGYSFSLIFMTYVISFIFRKGRKN------SGI-----WSFCF-YVVTVFSV-AGFAFSI
1110 1120 1130 1140 1150
1750 1760 1770 1780 1790 1800
pF1KSD FIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIGIN
: ..: . ..: :: ::... .: ::.
CCDS74 F----------ESDIPFIFTFL-------IP---PATMI-----------GC--LFL---
1160 1170 1180
1810 1820 1830 1840 1850 1860
pF1KSD SSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYARFGEEH
:: . : :: ..: .. :. :: : :: . :. : : :
CCDS74 SSHLLFS-SLFSEERMDVQPFLVF---LIPFLHFIIF--LFTL-----------RCLE--
1190 1200 1210 1220
1870 1880 1890 1900 1910 1920
pF1KSD SANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDDVAEER
: . :.. .. :.:. . . .:: ::.:: ::
CCDS74 ------WKFGKKSM-----------------RKDPFFSSDVCQNPEEP-EGEDEDVQMER
1230 1240 1250
1930 1940 1950 1960 1970
pF1KSD QRIITGGNKTD-----ILRLHELTKIYPGT---------SSPAVDRLCVGVRPGECFGLL
: .. :.:. .. : : : : .. :. . :: :: .:::
CCDS74 VRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKIATRNVSFCVRKGEVLGLL
1260 1270 1280 1290 1300 1310
1980 1990 2000 2010 2020 2030
pF1KSD GVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGRE
: :::::.:..:..:::: :.:.. . : .. ... . .::::: .:. :: :.
CCDS74 GHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEFLGYCPQENALWPNLTVRQ
1320 1330 1340 1350 1360 1370
2040 2050 2060 2070 2080 2090
pF1KSD HLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPPL
:: .:: ..:. . : . . . .: : . : : : :::: .....: : .
CCDS74 HLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSEGIKRKLCFVLSILGNPSV
1380 1390 1400 1410 1420 1430
2100 2110 2120 2130 2140 2150
pF1KSD VLLDEPTTGMDPQARRMLWNVIVSIIREG-RAVVLTSHSMEECEALCTRLAIMVKGAFRC
::::::.:::::......:..: . .:. :...::.: : : ::.: :.::::.: .::
CCDS74 VLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAEAEAVCDRVAIMVSGRLRC
1440 1450 1460 1470 1480 1490
2160 2170 2180 2190 2200 2210
pF1KSD MGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQV
.:.::::::::: :.. ::.:. : ...:.. . :: ....::. ... ...
CCDS74 IGSIQHLKSKFGKDYLLEMKVKN-----LAQVEPLHAEILRLFPQAARQERYSSLMVYKL
1500 1510 1520 1530 1540
2220 2230 2240 2250 2260
pF1KSD ---SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAGA
. . ::. : : . :.:. .::::..:.::.:::....:.:
CCDS74 PVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKEQELGDFEEDFDPSVKW
1550 1560 1570 1580 1590 1600
2270
pF1KSD SRQAQD
CCDS74 KLLPQEEP
1610
>>CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621 aa)
initn: 1279 init1: 488 opt: 753 Z-score: 659.6 bits: 135.4 E(32554): 2e-30
Smith-Waterman score: 1459; 26.9% identity (54.7% similar) in 1696 aa overlap (605-2252:173-1598)
580 590 600 610 620 630
pF1KSD IDVVEKTNKIKDRYWDSGPRADPVEDFRYIWG-GFAYLQDMVEQGI---TRSQVQAEAPV
: ::. :: .. .: : .. : .
CCDS74 HGMPAKKEHKDHTAHCYETNEDVYCEVSVFWKEGFVALQAAINAAIIEITTNHSVMEELM
150 160 170 180 190 200
640 650 660 670 680
pF1KSD GIYLQQMPYPCFVDDSFMIILNRCFPIFMVLA-WIYSVSMTVKSIVLEKELRLKETLKNQ
.. ..: . :. .: .: : .. .. .:: .:..: :.. :.: . .
CCDS74 SVTGKNMKMHSFIGQSGVITDLYLFSCIISFSSFIYYASVNVTR---ERK-RMKALMTMM
210 220 230 240 250
690 700 710 720 730 740
pF1KSD GVSNAVIWCTW-FLDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLC
:. ....: .: .: . :. :..:: .. : ... : ...: ..: .. . . :
CCDS74 GLRDSAFWLSWGLLYAGFIFIMALFL-ALVIRSTQFIILSGFMVVFSLFLLYGLSLVALA
260 270 280 290 300 310
750 760 770 780 790 800
pF1KSD FLLSTFFSKASLAAACSGVIYFTLYLPHILCFAWQD---RMTAELKKAVSLLSPVAFGFG
::.: . .:. : .:.. : : . :... . .. : :. .::::: :: .:
CCDS74 FLMSILVKKSFL----TGLVVFLLTV-FWGCLGFTSLYRHLPASLEWILSLLSPFAFMLG
320 330 340 350 360 370
810 820 830 840 850 860
pF1KSD TEYLVRFEEQGLGLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDY
:.... :. :: :..:... .. . :. .:. .: :: :.....:..:
CCDS74 MAQLLHLD---YDLN-SNAFPHPSDGSNL-IVATNFMLAFDTCLYLALAIYFEKILPNEY
380 390 400 410 420
870 880 890 900 910 920
pF1KSD GTPLPWYFLLQESYWLGGEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFEREHPGW
: : :.:. :.: .::. .. : : : ..:::: :. : .
CCDS74 GHRRPPLFFLKSSFW-----------SQTQKTDHVALEDEMDADP-SFHDSF-EQAPPEF
430 440 450 460 470
930 940 950 960 970
pF1KSD V--PGVCVKNLVKIFEPCGQP----AVDRLNITFYENQITAFLGHNGAGKTTTLSILTGL
.. ..:..: .. :.: :. : . .::.::::.:::.::::.: :.::.::
CCDS74 QGKEAIRIRNVTKEYK--GKPDKIEALKDLVFDIYEGQITAILGHSGAGKSTLLNILSGL
480 490 500 510 520 530
980 990 1000 1010 1020 1030
pF1KSD LPPTSGTVLVGGRDIE--TSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEE
::.:.: . . . ..:. . . :.::: :. : ::: :.. ..:..:: .:
CCDS74 SVPTKGSVTIYNNKLSEMADLENLSKLTGVCPQSNVQFDFLTVRENLRLFAKIKGILPQE
540 550 560 570 580 590
1040 1050 1060 1070 1080 1090
pF1KSD AQLEMEAMLEDTGLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSR
.. :.. .: . ... .. ::.::::..:::. .::..:: .. .:::::.:.::.::
CCDS74 VDKEIQRVLLELEMKNIQDVLAQNLSGGQKRKLTFGIAILGDPQIFLLDEPTAGLDPFSR
600 610 620 630 640 650
1100 1110 1120 1130 1140 1150
pF1KSD RSIWDLLLKYRSGRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYL
...:.:: . .. :.:..::. :::::.:.:: ....::.: :.:. ::::. .: : .:
CCDS74 HQVWNLLKERKTDRVILFSTQFMDEADILADRKVFLSQGKLKCAGSSLFLKKKWGIGYHL
660 670 680 690 700 710
1160 1170 1180 1190 1200 1210
pF1KSD TLVRKMKNIQSQRKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVP
.: ....: : ..... .: .:.:
CCDS74 SL--QLNEI------------CVEENITS------------------------LVKQHIP
720 730
1220 1230 1240 1250 1260 1270
pF1KSD EAKLVECIGQELIFLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVT
.::: .::. :: . . . :...:. . :::. ..:.: : :.:.:::.
CCDS74 DAKLSAKSEGKLIYTLPLE--RTNKFPELYKDLD-SYPDLGIENYGVSMTTLNEVFLKLE
740 750 760 770 780 790
1280 1290 1300 1310 1320 1330
pF1KSD EDS---DSGPLFAGGAQQKRENVNPRHPCLGPREKAGQTPQDSNVCSPGAPAAHPEGQPP
: .: . : .: .. . . : : :. : : . :
CCDS74 GKSTINESDIAILGEVQAEKADDTER---LVEMEQ---------VLSSLNKMRKTIG---
800 810 820 830
1340 1350 1360 1370 1380 1390
pF1KSD PEPECPGPQLNTGTQLVLQHVQALLVKRFQHTIRSHKDFLAQI-VLPATFVFLALMLSIV
:. : :.. :. :. . . .: .:: . .: : : : . ..:
CCDS74 ------------GVALWRQQICAIARVRLLKLKHERKALLALLLILMAGFCPLLVEYTMV
840 850 860 870 880
1400 1410 1420 1430 1440
pF1KSD IPPFGEYPALTLHPWIYGQQYTFFSMDEPGSEQFTVLADVLL-NKPG-----FGNRCLKE
. : . : : .: :.. ::.. :...:. :: : : . ..
CCDS74 KIYQNSY-TWELSPHLY-----FLA---PGQQPHDPLTQLLIINKTGASIDDFIQSVEHQ
890 900 910 920 930
1450 1460 1470 1480 1490 1500
pF1KSD GWLPEYPC-GNSTPWKTPSVSPNITQLFQKQKWTQVNPSPSCRCSTREKLTMLPECPEGA
. : :. . :: . :: ... : : : :... .:. .:
CCDS74 NIALEVDAFGTRNGTDDPSYNGAITVCCNEK-----NYSFSLACNAK-RLNCFP------
940 950 960 970 980
1510 1520 1530 1540 1550 1560
pF1KSD GGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALIRSSLKSKFWVNEQRYGGISIGGKL
.:.:... .. .:: :.. . .: : : :
CCDS74 --------------VLMDIVSNGLLG-MVK--PSVHIRTERSTFLENGQDN---------
990 1000 1010
1570 1580 1590 1600 1610 1620
pF1KSD PVVPITGEALVGFLSDLGRIMNVSGGPITREASKEIPDFLKHLETEDNIKVWFNNKGWHA
:: :::. . . .... : . : :. .. ... :. . : .
CCDS74 ---PI------GFLAYIMFWLVLTSSCPPYIAMSSIDDYKNRARSQLRISGLSPSAYWFG
1020 1030 1040 1050 1060
1630 1640 1650 1660 1670 1680
pF1KSD LVSFLNVAHNAILRASLPKDRSPEEYGITVISQPLNLTKEQLSEITVLTTSVDAVVAICV
....:. .. . . : .. ::. .. : : . . :.
CCDS74 Q-ALVDVSLYFLVFVFI--------YLMSYISNFEDM----------LLTIIHIIQIPCA
1070 1080 1090 1100
1690 1700 1710 1720 1730 1740
pF1KSD I-FSMSFVPASFVLYLIQERVNKSKHLQFISGVSPTTYWVTNFLWDIMNYSVSAGLVVGI
. .:.:.. ..:. .: .. :. ::. : : . . .:: ::.. .:
CCDS74 VGYSFSLIFMTYVISFIFRKGRKN------SGI-----WSFCF-YVVTVFSV-AGFAFSI
1110 1120 1130 1140 1150
1750 1760 1770 1780 1790 1800
pF1KSD FIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPASFLFDVPSTAYVALSCANLFIGIN
: ..: . ..: :: ::... .: ::.
CCDS74 F----------ESDIPFIFTFL-------IP---PATMI-----------GC--LFL---
1160 1170 1180
1810 1820 1830 1840 1850 1860
pF1KSD SSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCLGRGLIDLALSQAVTDVYARFGEEH
:: . : :: ..: .. :. :: : :: . :. : . .::..
CCDS74 SSHLLFS-SLFSEERMDVQPFLVF---LIPFLHFII--FLFTLRCLE------WKFGKKS
1190 1200 1210 1220
1870 1880 1890 1900 1910 1920
pF1KSD -SANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHFFLSQWIAEPTKEPIVDEDDDVAEE
.:: : .. : :. . . .:: ::.:: :
CCDS74 MRKDPF-------------------FRIS---PR----SSDVCQNPEEP-EGEDEDVQME
1230 1240 1250 1260
1930 1940 1950 1960 1970
pF1KSD RQRIITGGNKTD-----ILRLHELTKIYPGT---------SSPAVDRLCVGVRPGECFGL
: : .. :.:. .. : : : : .. :. . :: :: .::
CCDS74 RVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSKRKNKIATRNVSFCVRKGEVLGL
1270 1280 1290 1300 1310 1320
1980 1990 2000 2010 2020 2030
pF1KSD LGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYCPQFDAIDELLTGR
:: :::::.:..:..:::: :.:.. . : .. ... . .::::: .:. :: :
CCDS74 LGHNGAGKSTSIKVITGDTKPTAGQVLLKG----SGGGDALEFLGYCPQENALWPNLTVR
1330 1340 1350 1360 1370
2040 2050 2060 2070 2080 2090
pF1KSD EHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKRKLSTAIALIGCPP
.:: .:: ..:. . : . . . .: : . : : : :::: .....: :
CCDS74 QHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPVKTLSEGIKRKLCFVLSILGNPS
1380 1390 1400 1410 1420 1430
2100 2110 2120 2130 2140
pF1KSD LVLLDEPTTGMDPQARRMLWNVIVSIIREG-RAVVLTSHSMEECEALCTRLAIMVKGAFR
.::::::.:::::......:..: . .:. :...::.: : : ::.: :.::::.: .:
CCDS74 VVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTTHYMAEAEAVCDRVAIMVSGRLR
1440 1450 1460 1470 1480 1490
2150 2160 2170 2180 2190 2200
pF1KSD CMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSVQRERHYNMLQFQ
:.:.::::::::: :.. ::.:. : ...:.. . :: ....::. ... ..
CCDS74 CIGSIQHLKSKFGKDYLLEMKVKN-----LAQVEPLHAEILRLFPQAARQERYSSLMVYK
1500 1510 1520 1530 1540 1550
2210 2220 2230 2240 2250 2260
pF1KSD V---SSSSLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTESHDLPLHPRAAG
. . . ::. : : . :.:. .::::..:.::.:::....:.:
CCDS74 LPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELSKEQELGDFEEDFDPSVK
1560 1570 1580 1590 1600 1610
2270
pF1KSD ASRQAQD
CCDS74 WKLLPQEEP
1620
2273 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:20:44 2016 done: Thu Nov 3 19:20:45 2016
Total Scan time: 6.360 Total Display time: 2.030
Function used was FASTA [36.3.4 Apr, 2011]