FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1062, 2435 aa
1>>>pF1KA1062 2435 - 2435 aa - 2435 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.9765+/-0.00102; mu= 14.3879+/- 0.062
mean_var=150.5154+/-30.214, 0's: 0 Z-trim(109.5): 63 B-trim: 117 in 1/51
Lambda= 0.104540
statistics sampled from 10905 (10967) to 10905 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.662), E-opt: 0.2 (0.337), width: 16
Scan time: 7.900
The best scores are: opt bits E(32554)
CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436) 16186 2454.5 0
CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261) 2484 388.0 2.9e-106
CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273) 2288 358.4 2.3e-97
CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146) 2207 346.2 1e-93
CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058) 1627 258.9 4.6e-67
CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277) 1396 223.9 7.3e-57
CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595) 1396 223.9 8.1e-57
CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704) 1139 185.0 2.7e-45
CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642) 722 122.1 2.2e-26
CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616) 718 121.5 3.3e-26
CCDS74139.1 ABCA8 gene_id:10351|Hs108|chr17 (1621) 718 121.5 3.3e-26
CCDS11684.1 ABCA10 gene_id:10349|Hs108|chr17 (1543) 707 119.9 1e-25
CCDS11681.1 ABCA9 gene_id:10350|Hs108|chr17 (1624) 691 117.5 5.6e-25
CCDS11683.1 ABCA6 gene_id:23460|Hs108|chr17 (1617) 660 112.8 1.4e-23
>>CCDS43909.1 ABCA2 gene_id:20|Hs108|chr9 (2436 aa)
initn: 15849 init1: 15849 opt: 16186 Z-score: 13189.2 bits: 2454.5 E(32554): 0
Smith-Waterman score: 16186; 99.8% identity (100.0% similar) in 2436 aa overlap (1-2435:1-2436)
10 20 30 40 50
pF1KA1 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKE-AFYTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::: .:::::
CCDS43 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKEVSFYTAA
10 20 30 40 50 60
60 70 80 90 100 110
pF1KA1 PLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSLGSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSLGSE
70 80 90 100 110 120
120 130 140 150 160 170
pF1KA1 LEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPNSTAQAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPNSTAQAL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KA1 LAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPALLEQLTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPALLEQLTC
190 200 210 220 230 240
240 250 260 270 280 290
pF1KA1 TPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVAKVSQQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVAKVSQQL
250 260 270 280 290 300
300 310 320 330 340 350
pF1KA1 GLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGACTGRTPGPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGACTGRTPGPP
310 320 330 340 350 360
360 370 380 390 400 410
pF1KA1 ASGAGGAANGTGAGAVMGPNATAEEGAPSAAALATPDTLQGQCSAFVQLWAGLQPILCGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ASGAGGAANGTGAGAVMGPNATAEEGAPSAAALATPDTLQGQCSAFVQLWAGLQPILCGN
370 380 390 400 410 420
420 430 440 450 460 470
pF1KA1 NRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETF
430 440 450 460 470 480
480 490 500 510 520 530
pF1KA1 AFVGNVTHYAQVWLNISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPA
::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::
CCDS43 AFVGNVTHYAQVWLNISAEIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPA
490 500 510 520 530 540
540 550 560 570 580 590
pF1KA1 LRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQD
550 560 570 580 590 600
600 610 620 630 640 650
pF1KA1 NVTVFASVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLYGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NVTVFASVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLYGF
610 620 630 640 650 660
660 670 680 690 700 710
pF1KA1 VWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSV
670 680 690 700 710 720
720 730 740 750 760 770
pF1KA1 AMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVLMH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVLMH
730 740 750 760 770 780
780 790 800 810 820 830
pF1KA1 SHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAH
790 800 810 820 830 840
840 850 860 870 880 890
pF1KA1 DKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTML
850 860 870 880 890 900
900 910 920 930 940 950
pF1KA1 MVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSV
910 920 930 940 950 960
960 970 980 990 1000 1010
pF1KA1 MEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLYENQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLYENQV
970 980 990 1000 1010 1020
1020 1030 1040 1050 1060 1070
pF1KA1 VSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRL
1030 1040 1050 1060 1070 1080
1080 1090 1100 1110 1120 1130
pF1KA1 TVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVG
1090 1100 1110 1120 1130 1140
1140 1150 1160 1170 1180 1190
pF1KA1 GSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKL
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230 1240 1250
pF1KA1 KCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRK
1210 1220 1230 1240 1250 1260
1260 1270 1280 1290 1300 1310
pF1KA1 HVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFL
:::::::::::::::::::::::::::::::::.::::::::::::::::::::::::::
CCDS43 HVASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFL
1270 1280 1290 1300 1310 1320
1320 1330 1340 1350 1360 1370
pF1KA1 KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVG
1330 1340 1350 1360 1370 1380
1380 1390 1400 1410 1420 1430
pF1KA1 SARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQF
1390 1400 1410 1420 1430 1440
1440 1450 1460 1470 1480 1490
pF1KA1 HGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQ
1450 1460 1470 1480 1490 1500
1500 1510 1520 1530 1540 1550
pF1KA1 PRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLS
1510 1520 1530 1540 1550 1560
1560 1570 1580 1590 1600 1610
pF1KA1 SGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA
1570 1580 1590 1600 1610 1620
1620 1630 1640 1650 1660 1670
pF1KA1 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS
1630 1640 1650 1660 1670 1680
1680 1690 1700 1710 1720 1730
pF1KA1 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM
1690 1700 1710 1720 1730 1740
1740 1750 1760 1770 1780 1790
pF1KA1 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVVIAIFII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVVIAIFII
1750 1760 1770 1780 1790 1800
1800 1810 1820 1830 1840 1850
pF1KA1 VAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILF
1810 1820 1830 1840 1850 1860
1860 1870 1880 1890 1900 1910
pF1KA1 VFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITAT
1870 1880 1890 1900 1910 1920
1920 1930 1940 1950 1960 1970
pF1KA1 VATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKM
1930 1940 1950 1960 1970 1980
1980 1990 2000 2010 2020 2030
pF1KA1 KSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQR
1990 2000 2010 2020 2030 2040
2040 2050 2060 2070 2080 2090
pF1KA1 VLRGDADNDMVKIENLTKVYKSRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VLRGDADNDMVKIENLTKVYKSRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKM
2050 2060 2070 2080 2090 2100
2100 2110 2120 2130 2140 2150
pF1KA1 LTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISW
2110 2120 2130 2140 2150 2160
2160 2170 2180 2190 2200 2210
pF1KA1 KDEARVVKWALEKLELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KDEARVVKWALEKLELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPK
2170 2180 2190 2200 2210 2220
2220 2230 2240 2250 2260 2270
pF1KA1 ARRFLWNLILDLIKTGRSVVLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ARRFLWNLILDLIKTGRSVVLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDG
2230 2240 2250 2260 2270 2280
2280 2290 2300 2310 2320 2330
pF1KA1 YMITVRTKSSQSVKDVVRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YMITVRTKSSQSVKDVVRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSG
2290 2300 2310 2320 2330 2340
2340 2350 2360 2370 2380 2390
pF1KA1 VLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTEL
2350 2360 2370 2380 2390 2400
2400 2410 2420 2430
pF1KA1 RALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC
::::::::::::::::::::::::::::::::::::
CCDS43 RALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC
2410 2420 2430
>>CCDS6762.1 ABCA1 gene_id:19|Hs108|chr9 (2261 aa)
initn: 3777 init1: 1060 opt: 2484 Z-score: 2021.2 bits: 388.0 E(32554): 2.9e-106
Smith-Waterman score: 5209; 40.3% identity (64.5% similar) in 2475 aa overlap (1-2367:1-2227)
10 20 30 40 50 60
pF1KA1 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKEAFYTAAP
:. ::.::::::.:..::. : .:. :: .:.::...: . : .: .
CCDS67 MACWPQLRLLLWKNLTFRRRQTCQLLLEVAWPLFIFLILISVRLSYPPYEQHECHFPNKA
10 20 30 40 50 60
70 80 90 100 110
pF1KA1 LTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDRVVEEGNLFDPARPSL----
. ::: :: .:.. ... : . . . . .. ... . . ::. :: :
CCDS67 MPSAGTLPWVQGIICNANNPCFRY--PTPGEAPGVVGNFNKSIV-ARLFSDARRLLLYSQ
70 80 90 100 110
120 130 140 150 160 170
pF1KA1 -GSELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSLPNST
. .. .:. :..:. .. .:. :...:.. . . . :: .:::::.::
CCDS67 KDTSMKDMRKVLRTLQ--------QIKKSS-SNLKLQDFLVDNETFSGFLYHNLSLPKST
120 130 140 150 160
180 190 200 210 220 230
pF1KA1 AQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAPALLE
.. .: : : . : .: . : : : .:. . ::..
CCDS67 VDKMLRADV----ILHKVFLQGYQLHLTS-LCNGS------------KSEEMI-------
170 180 190 200
240 250 260 270 280 290
pF1KA1 QLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLDVAK-
:: :. :.... .:. .: : :: :. ::...:. :
CCDS67 QL----GDQEVSELCGLPR-EKLA------------AAERV---------LRSNMDILKP
210 220 230
300 310 320 330 340
pF1KA1 VSQQLGLDAPNGSDSSPQAPPP--RRLQALLGDLLDA-------QKVLQDVDVLSALALL
. . :. .: : .: . : .: .:.. :.:. ..: :. .
CCDS67 ILRTLNSTSPFPSKELAEATKTLLHSLGTLAQELFSMRSWSDMRQEVMFLTNVNSSSSST
240 250 260 270 280 290
350 360 370 380 390
pF1KA1 LPQGACTGRTPGPPASGAGGAAN-----GTGAGAVMGPNATAEEGAPSAAALATP---DT
: . . : : .:. . .. :..: :.: :.. .:: :
CCDS67 QIYQAVSRIVCGHPEGGGLKIKSLNWYEDNNYKALFGGNGTEEDAETFYDNSTTPYCNDL
300 310 320 330 340 350
400 410 420 430 440 450
pF1KA1 LQGQCSAFVQ--LWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTS
... :. .. .: .:.:.: :
CCDS67 MKNLESSPLSRIIWKALKPLLVG-------------------------------------
360 370 380
460 470 480 490 500 510
pF1KA1 NPKILYAPAGSEVDRVILKANETFAFVGNVTHYAQVWLNISAKIRSFLEQGRLQQHLR--
::::.: . .:. ..:.:: .. .: ..: :: .:.:... .. .:
CCDS67 --KILYTPDTPATRQVMAEVNKTFQELAVFHDLEGMWEELSPKIWTFMENSQEMDLVRML
390 400 410 420 430
520 530 540 550 560
pF1KA1 ---------WLQQYVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAA
: :: . : . . : . : ....: :. .. . .. ..:
CCDS67 LDSRDNDHFWEQQ-LDGLDWTAQDIVAFLAKHPEDVQSSNGSV---YTWREAFNETNQAI
440 450 460 470 480 490
570 580 590 600 610 620
pF1KA1 CGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKDGS--LPPHVH
.:: :... .. . : ..: ... :. .:...: :: :: ::.
CCDS67 RTISRFMECVNLNKLEPIATEVWLINKSME--LLDERKFWAGIVFTGITPGSIELPHHVK
500 510 520 530 540 550
630 640 650 660 670
pF1KA1 YKIRQNSSFTEKTNEIRRAYWRPGPNTG---GRFYFLYGFVWIQDMMERAIIDTFVGHDV
::::.. . .:.::.:. .:: ::: . : ::...::..:.::: ...: .
CCDS67 YKIRMDIDNVERTNKIKDGYWDPGPRADPFEDMRYVWGGFAYLQDVVEQAIIRVLTGTEK
560 570 580 590 600 610
680 690 700 710 720 730
pF1KA1 VEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMK
. : :.:..:::::. : :: :. . ::: :...:.::::. :. :: ::: ::::.:.
CCDS67 -KTGVYMQQMPYPCYVDDIFLRVMSRSMPLFMTLAWIYSVAVIIKGIVYEKEARLKETMR
620 630 640 650 660 670
740 750 760 770 780 790
pF1KA1 TMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMF
:::.:.. : .:::.... : .:. :..::: :..: .: ....::.:.::.::.
CCDS67 IMGLDNSILWFSWFISSLIPLLVSAGLLVVILKLGNLLPYSDPSVVFVFLSVFAVVTILQ
680 690 700 710 720 730
800 810 820 830 840 850
pF1KA1 CFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFE-KCIASLMSTTAF
:::.:.:.:.:.::.:::::::: :.::. :: . ..: : .:::.: .::
CCDS67 CFLISTLFSRANLAAACGGIIYFTLYLPYVLC-----VAWQDYVGFTLKIFASLLSPVAF
740 750 760 770 780
860 870 880 890 900 910
pF1KA1 GLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHP
:.: .::::.: :.:.:: .. .:::: : ::: .:.:.. :. .::..::::::: :
CCDS67 GFGCEYFALFEEQGIGVQWDNLFESPVEEDGFNLTTSVSMMLFDTFLYGVMTWYIEAVFP
790 800 810 820 830 840
920 930 940 950 960 970
pF1KA1 GMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRG
:.::.::::::: ::::.: :. : : : . :.: . :
CCDS67 GQYGIPRPWYFPCTKSYWFG---EESDEKSHPGSNQKRIS-----EIC------------
850 860 870 880
980 990 1000 1010 1020 1030
pF1KA1 MEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILT
:::::::: : : ...:.:::.: :.:.. :.::.::.:..::::::::::::::::::
CCDS67 MEEEPTHLKLGVSIQNLVKVYRDGMKVAVDGLALNFYEGQITSFLGHNGAGKTTTMSILT
890 900 910 920 930 940
1040 1050 1060 1070 1080 1090
pF1KA1 GLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEE
::::::::.: : :.:::.::. ::.:::.::::::::: ::::::.:::.:::......
CCDS67 GLFPPTSGTAYILGKDIRSEMSTIRQNLGVCPQHNVLFDMLTVEEHIWFYARLKGLSEKH
950 960 970 980 990 1000
1100 1110 1120 1130 1140 1150
pF1KA1 IRREMDKMIEDLEL-SNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYA
.. ::..: :. : :.: .: .. :::::.::::::.::::::...::::::::::::.
CCDS67 VKAEMEQMALDVGLPSSKLKSKTSQLSGGMQRKLSVALAFVGGSKVVILDEPTAGVDPYS
1010 1020 1030 1040 1050 1060
1160 1170 1180 1190 1200 1210
pF1KA1 RRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYR
::.::.:.:::. ::::.::::::::::.::::::::::::: : :: ::::. : ::
CCDS67 RRGIWELLLKYRQGRTIILSTHHMDEADVLGDRIAIISHGKLCCVGSSLFLKNQLGTGYY
1070 1080 1090 1100 1110 1120
1220 1230 1240 1250
pF1KA1 LTLVKRPAEPGGP------------QEPGLASSPPGRAPLSSCSELQ--------VSQFI
:::::. .: . .. .:. . : :.: : . .:..:
CCDS67 LTLVKKDVESSLSSCRNSSSTVSYLKKEDSVSQSSSDAGLGSDHESDTLTIDVSAISNLI
1130 1140 1150 1160 1170 1180
1260 1270 1280 1290 1300 1310
pF1KA1 RKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEV
::::. :: : . ::.:.:: ::::.::: .::.... :. : .::.:. .:::::.
CCDS67 RKHVSEARLVEDIGHELTYVLPYEAAKEGAFVELFHEIDDRLSDLGISSYGISETTLEEI
1190 1200 1210 1220 1230 1240
1320 1330 1340 1350 1360 1370
pF1KA1 FLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASS
::::.:: : .:. :. .::
CCDS67 FLKVAEE------SGVDA-ETSDGTLP---------------------------------
1250 1260
1380 1390 1400 1410 1420 1430
pF1KA1 VGSARGDEGAGYTDVYGDYRPLF-DNPQDPDNVSL--QEVEAEALSRV-GQGSRKLDGGW
:: .. : . : . ::. :. ::.. .. . :.. :: . :.:: .. :
CCDS67 ---ARRNRRA-FGDKQSCLRPFTEDDAADPNDSDIDPESRETDLLSGMDGKGSYQVKGWK
1270 1280 1290 1300 1310 1320
1440 1450 1460 1470 1480 1490
pF1KA1 LKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQ
: .:: .:: ::. :::. :..:.::.::: :::.:.. .: :: .: : : :.: .
CCDS67 LTQQQFVALLWKRLLIARRSRKGFFAQIVLPAVFVCIALVFSLIVPPFGKYPSLELQPWM
1330 1340 1350 1360 1370 1380
1500 1510 1520 1530 1540 1550
pF1KA1 YHN-YTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSL
:.. :: :. : :.. .:.... : :. :. .:
CCDS67 YNEQYT-----FVSNDAPE----------DTGTLELLNALTKDPGFGTRCMEGNPI----
1390 1400 1410 1420
1560 1570 1580 1590 1600 1610
pF1KA1 GPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWN
: ..:: . .: ... .. : .: :.. ::::
CCDS67 -PDTPCQAGEEEWTTAPVPQTI-MDLFQNG----NWTMQNPSPA----------------
1430 1440 1450 1460
1620 1630 1640 1650 1660 1670
pF1KA1 VSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGG-HPPQMRVVTGDILT
:. .. ... :: :: ..:: ::: . :.:::
CCDS67 ----------CQCSSDKIKKML--PV------------CPPGAGGLPPPQRKQNTADILQ
1470 1480 1490
1680 1690 1700 1710
pF1KA1 DITGHNVSEYLLFT-------SDRFRL----HRYGAITFG--NVLKSIPASFGTRAPPMV
:.::.:.:.::. : : . .. :::....: :. :.. . : ..
CCDS67 DLTGRNISDYLVKTYVQIIAKSLKNKIWVNEFRYGGFSLGVSNTQALPPSQEVNDAIKQM
1500 1510 1520 1530 1540 1550
1720 1730 1740 1750
pF1KA1 RK-----------------------IAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANL
.: . .. ..:..::::.:.. ..:: .:::::::::
CCDS67 KKHLKLAKDSSADRFLNSLGRFMTGLDTKNNVKVWFNNKGWHAISSFLNVINNAILRANL
1560 1570 1580 1590 1600 1610
1760 1770 1780 1790 1800 1810
pF1KA1 PKSKGNPAAYGITVTNHPMNKTSASLS-LDYLLQGTDVVIAIFIIVAMSFVPASFVVFLV
:.. ::. ::::. :::.: :. .:: . . ..::...: .: :::::::::::::.
CCDS67 QKGE-NPSHYGITAFNHPLNLTKQQLSEVALMTTSVDVLVSICVIFAMSFVPASFVVFLI
1620 1630 1640 1650 1660 1670
1820 1830 1840 1850 1860 1870
pF1KA1 AEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPA
:. .:::::::.:: .:.::::.:.:::: ::.:::: .::.. :. .:.: ::.:.
CCDS67 QERVSKAKHLQFISGVKPVIYWLSNFVWDMCNYVVPATLVIIIFICFQQKSYVSSTNLPV
1680 1690 1700 1710 1720 1730
1880 1890 1900 1910 1920 1930
pF1KA1 VLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDL
. :.:::::::::.:::::: :..::.::: : .::::::...::::.:.:: .: :
CCDS67 LALLLLLYGWSITPLMYPASFVFKIPSTAYVVLTSVNLFIGINGSVATFVLELFTDNK-L
1740 1750 1760 1770 1780 1790
1940 1950 1960 1970 1980 1990
pF1KA1 KVVNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVA
. .:. ::: :::::.. ::.::..:. :. . . ..:. ... ::. ::.: :.: :
CCDS67 NNINDILKSVFLIFPHFCLGRGLIDMVKNQAMADALERFGE-NRFVSPLSWDLVGRNLFA
1800 1810 1820 1830 1840 1850
2000 2010 2020 2030 2040 2050
pF1KA1 MAVEGVVGFLLTIMCQYNFLRRPQRMPVSTKPVED-DVDVASERQRVLRGDADNDMVKIE
::::::: ::.:.. :: :. ::. . .. .:..: : :: ::::.: : ..::...:.
CCDS67 MAVEGVVFFLITVLIQYRFFIRPRPVNAKLSPLNDEDEDVRRERQRILDGGGQNDILEIK
1860 1870 1880 1890 1900 1910
2060 2070 2080 2090 2100 2110
pF1KA1 NLTKVYKSRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFV
.:::.:. :: : ::::.:.:. :::::::::::::::.::::::::: ..: :.::.
CCDS67 ELTKIYR-RK--RKPAVDRICVGIPPGECFGLLGVNGAGKSSTFKMLTGDTTVTRGDAFL
1920 1930 1940 1950 1960 1970
2120 2130 2140 2150 2160 2170
pF1KA1 NGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKL
: .:.:... .:.:..::::: ::. . ::.:::..... :::. :. ..: .::..::
CCDS67 NKNSILSNIHEVHQNMGYCPQFDAITELLTGREHVEFFALLRGVPEKEVGKVGEWAIRKL
1980 1990 2000 2010 2020 2030
2180 2190 2200 2210 2220 2230
pF1KA1 ELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIK
:.::..: ::.::::::::::::.:::: : .::::::::::::::::::: :...:
CCDS67 GLVKYGEKYAGNYSGGNKRKLSTAMALIGGPPVVFLDEPTTGMDPKARRFLWNCALSVVK
2040 2050 2060 2070 2080 2090
2240 2250 2260 2270 2280 2290
pF1KA1 TGRSVVLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQ-SV
::::::::::::::::::::.:::::::.:::::.::::::::::: :.:: .:. ..
CCDS67 EGRSVVLTSHSMEECEALCTRMAIMVNGRFRCLGSVQHLKNRFGDGYTIVVRIAGSNPDL
2100 2110 2120 2130 2140 2150
2300 2310 2320 2330 2340 2350
pF1KA1 KDVVRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTT
: : ::. :: ..:::.:.. .:::: : :::..:: . : . : ::::::::::
CCDS67 KPVQDFFGLAFPGSVLKEKHRNMLQYQLPSSLSSLARIFSILSQSKKRLHIEDYSVSQTT
2160 2170 2180 2190 2200 2210
2360 2370 2380 2390 2400 2410
pF1KA1 LDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDT
::.::::::: :::.
CCDS67 LDQVFVNFAKDQSDDDHLKDLSLHKNQTVVDVAVLTSFLQDEKVKESYV
2220 2230 2240 2250 2260
>>CCDS747.1 ABCA4 gene_id:24|Hs108|chr1 (2273 aa)
initn: 4252 init1: 1041 opt: 2288 Z-score: 1861.4 bits: 358.4 E(32554): 2.3e-97
Smith-Waterman score: 4809; 37.1% identity (64.1% similar) in 2460 aa overlap (1-2367:1-2255)
10 20 30 40 50 60
pF1KA1 MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQKKPTISVKEAFYTAAP
:::..:.::::::: ::..:. .. :. :: ::..:. ::. .: : .: .
CCDS74 MGFVRQIQLLLWKNWTLRKRQKIRFVVELVWPLSLFLVLIWLRNANPLYSHHECHFPNKA
10 20 30 40 50 60
70 80 90 100 110
pF1KA1 LTSAGILPVMQSL-C----PDGQRDEFGFLQYANSTVTQ-LLERLDRVVEEGNLFDPARP
. :::.:: .:.. : : : : :. .. .: :. : .: . :
CCDS74 MPSAGMLPWLQGIFCNVNNPCFQSPTPGESPGIVSNYNNSILARVYRDFQELLMNAPESQ
70 80 90 100 110 120
120 130 140 150 160 170
pF1KA1 SLG---SELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQELWRFLTQNLSL
:: .::. : : ...: . : .: . .. . .. .. . : :: .:..:
CCDS74 HLGRIWTELHILSQFMDTLRTHP-------ERIAGRGIRIRDILKDEETLTLFLIKNIGL
130 140 150 160 170
180 190 200 210 220 230
pF1KA1 PNSTAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLGGNPLFRMEELLLAP
.:.. :. ..: : . : : : . .... .
CCDS74 SDSVVYLLINSQVRPEQFAH--------------------------GVPDLALKDIACSE
180 190 200
240 250 260 270 280 290
pF1KA1 ALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAARARRFSGLSAELRNQLD
::::.. . ::. . . : :.:: . .. .. . : ..:
CCDS74 ALLERF--------------IIFSQRRGAKTVRYALCSLSQGT----LQWIEDTLYANVD
210 220 230 240
300 310 320 330 340 350
pF1KA1 VAKVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVLQDVDVLSALALLLPQGAC
:. . : :. :: :. : ..:.:. . .. . . : ::
CCDS74 FFKLFRVL----PTLLDSRSQGINLRSWGGILSDM--SPRIQEFIHRPSMQDLLW-----
250 260 270 280 290
360 370 380 390 400
pF1KA1 TGRTPGPPASGAGGAANGTGAGAVMGPNATAEEGAPSAAA---LATPDTLQGQCSAFVQL
. : : :: . : .:: . : : ... :. ... .::. .
CCDS74 VTR----PLMQNGGPETFT---KLMGILSDLLCGYPEGGGSRVLSFNWYEDNNYKAFLGI
300 310 320 330 340 350
410 420 430 440 450 460
pF1KA1 WAGLQ-PILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSE
. . :: . :: .. : .:. : : :: ::::.: .
CCDS74 DSTRKDPIYSYDRRTTSFCNALIQSLESNPLTKIAWRAAKPL--LM---GKILYTPDSPA
360 370 380 390 400
470 480 490 500 510
pF1KA1 VDRVILKANETFAFVGNVTHYAQVWLNISAKIRSFLEQGRLQQHLR----------WLQQ
. :.. .:: :: . .: . ...: ... .: :.... .. .: .:..
CCDS74 ARRILKNANSTFEELEHVRKLVKAWEEVGPQIWYFFDNSTQMNMIRDTLGNPTVKDFLNR
410 420 430 440 450 460
520 530 540 550 560 570
pF1KA1 YVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVD
..: . ::. : . : . :... .. . .. : . :.. . .:
CCDS74 QLGEEGITAEAILNFLYKGPRESQADDMA---NFDWRDIFNITDRTLRLVNQYLECLVLD
470 480 490 500 510 520
580 590 600 610 620 630
pF1KA1 IFKGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKD--GSLPPHVHYKIRQNSSFTEKT
:... :: .... .:. ..:. .:.:.: .::::::.::::.. . .:::
CCDS74 KFESYNDETQLTQRALSL-LEENM-FWAGVVFPDMYPWTSSLPPHVKYKIRMDIDVVEKT
530 540 550 560 570 580
640 650 660 670 680 690
pF1KA1 NEIRRAYWRPGPNTGGRFYFLY---GFVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYP
:.:. :: :: . : : ::...:::.:..: . : .. : :.:..:::
CCDS74 NKIKDRYWDSGPRADPVEDFRYIWGGFAYLQDMVEQGITRSQVQAEA-PVGIYLQQMPYP
590 600 610 620 630 640
700 710 720 730 740 750
pF1KA1 CYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAW
:.. :.:...... .:. ::..:.:::.::.. :: ::: ::::..:..:..::: : .:
CCDS74 CFVDDSFMIILNRCFPIFMVLAWIYSVSMTVKSIVLEKELRLKETLKNQGVSNAVIWCTW
650 660 670 680 690 700
760 770 780 790 800 810
pF1KA1 FITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKL
:. .: .:.:. :: .. .:..: .: :..::: ....::::.:::.:...:::.:
CCDS74 FLDSFSIMSMSIFLLTIFIMHGRILHYSDPFILFLFLLAFSTATIMLCFLLSTFFSKASL
710 720 730 740 750 760
820 830 840 850 860 870
pF1KA1 ASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAG
:.::.:.::: :.:.. . :..:: : .::.: .:::.:..:.. .: :
CCDS74 AAACSGVIYFTLYLPHILCFAWQ----DRMTAELKKAVSLLSPVAFGFGTEYLVRFEEQG
770 780 790 800 810
880 890 900 910 920 930
pF1KA1 VGIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQ
.:.:: ....::.:::.:..::.. :...::.:::.:.::.. : :: :: : :::: ::
CCDS74 LGLQWSNIGNSPTEGDEFSFLLSMQMMLLDAAVYGLLAWYLDQVFPGDYGTPLPWYFLLQ
820 830 840 850 860 870
940 950 960 970 980 990
pF1KA1 KSYWLGSGRTEAWEWSWPWARTPRLSVMEED--QACAMESRRFEETRGMEEEPTHLPLVV
.::::: :. . . .: :. :: . .... :: .:.: .: :
CCDS74 ESYWLG-GEGCSTREERALEKTEPLTEETEDPEHPEGIHDSFFE-----REHPGWVPGV-
880 890 900 910 920
1000 1010 1020 1030 1040 1050
pF1KA1 CVDKLTKVYKDDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATI
:: .:.:... . :...:....::::...::::::::::::.::::::.:::::.. .
CCDS74 CVKNLVKIFEPCGRPAVDRLNITFYENQITAFLGHNGAGKTTTLSILTGLLPPTSGTVLV
930 940 950 960 970 980
1060 1070 1080 1090 1100 1110
pF1KA1 YGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDL
:.::.: .: .:..::::::::.:: .::: ::. ::..::. .::: . ::. :.::
CCDS74 GGRDIETSLDAVRQSLGMCPQHNILFHHLTVAEHMLFYAQLKGKSQEEAQLEMEAMLEDT
990 1000 1010 1020 1030 1040
1120 1130 1140 1150 1160 1170
pF1KA1 ELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKP
: .::. .: :::::.::::::::::: ....::::::.:::::.::.::::.:::.
CCDS74 GLHHKRNEEAQDLSGGMQRKLSVAIAFVGDAKVVILDEPTSGVDPYSRRSIWDLLLKYRS
1050 1060 1070 1080 1090 1100
1180 1190 1200 1210 1220
pF1KA1 GRTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKR----PAE
::::..::::::::::::::::::..:.: : :.:::::. .: : ::::.. ..
CCDS74 GRTIIMSTHHMDEADLLGDRIAIIAQGRLYCSGTPLFLKNCFGTGLYLTLVRKMKNIQSQ
1110 1120 1130 1140 1150 1160
1230 1240 1250 1260 1270
pF1KA1 PGGPQ------EPGLASSPPGRAP-LSSCSEL-----QVSQFIRKHVASCLLVSDTSTEL
: . :.... :... :. . : .. . . .:: :: . ::
CCDS74 RKGSEGTCSCSSKGFSTTCPAHVDDLTPEQVLDGDVNELMDVVLHHVPEAKLVECIGQEL
1170 1180 1190 1200 1210 1220
1280 1290 1300 1310 1320 1330
pF1KA1 SYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEAD
..::.. :. :. :::.::..: : :::::. :: :::.::::.:...: .
CCDS74 IFLLPNKNFKHRAYASLFRELEETLADLGLSSFGISDTPLEEIFLKVTEDSDSGPLFAGG
1230 1240 1250 1260 1270 1280
1340 1350 1360 1370 1380 1390
pF1KA1 VKESRKDVLPGAEGPASG-EGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVY
....:..: : . : : . .::. . :.. . : : ::
CCDS74 AQQKRENVNP--RHPCLGPREKAGQTPQDSNVCSPGAP---------AAHPEG-------
1290 1300 1310 1320 1330
1400 1410 1420 1430 1440 1450
pF1KA1 GDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRN
.: : .:. : . : : ... ..::::::. . :.
CCDS74 ---QP----PPEPEC---------------PGPQLNTGTQLVLQHVQALLVKRFQHTIRS
1340 1350 1360
1460 1470 1480 1490 1500 1510
pF1KA1 SKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERR
: ...::.::: :: .:. ... .: .:. : :.: : : .
CCDS74 HKDFLAQIVLPATFVFLALMLSIVIPPFGEYPALTLHPWIYG-----------------Q
1370 1380 1390 1400 1410
1520 1530 1540 1550 1560 1570
pF1KA1 EYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDS
.: . . . .:.. : : .:..:. : .
CCDS74 QYTFFSMDEPGSEQFT--------VLADVLLNKPG----------------------FGN
1420 1430 1440
1580 1590 1600 1610 1620 1630
pF1KA1 MCL-ESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPR
:: :.. : .: : .:: :: :.. . ::.. :
CCDS74 RCLKEGWLPEYPCGN---STPWKTPSVSP----------NIT--QLFQKQKWTQVNPSP-
1450 1460 1470 1480
1640 1650 1660 1670 1680
pF1KA1 LVREPVRCTCSAQGTGFS-CPSSVGGHPPQMRVV-TGDILTDITGHNVSEYLLFT-----
::. . : . :: ..:: :: .:. . .:: :.: .:.:..:. :
CCDS74 ----SCRCSTREKLTMLPECPEGAGGLPPPQRTQRSTEILQDLTDRNISDFLVKTYPALI
1490 1500 1510 1520 1530 1540
1690 1700 1710
pF1KA1 ----SDRFRLH--RYGAITFGNVLKSIPAS----------FG----------TRA-----
...: .. :::.:..:. : .: . .: ::
CCDS74 RSSLKSKFWVNEQRYGGISIGGKLPVVPITGEALVGFLSDLGRIMNVSGGPITREASKEI
1550 1560 1570 1580 1590 1600
1720 1730 1740 1750 1760 1770
pF1KA1 PPMVRKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPM
: ..... .. .:..::::.:.. ..:: .::::::.:::.. .: ::::: ..:.
CCDS74 PDFLKHLETEDNIKVWFNNKGWHALVSFLNVAHNAILRASLPKDR-SPEEYGITVISQPL
1610 1620 1630 1640 1650 1660
1780 1790 1800 1810 1820 1830
pF1KA1 NKTSASLS-LDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPI
: :. .:: . : ..:.:.:: .: .:::::::::..:. :. .:.:::::.:: .:
CCDS74 NLTKEQLSEITVLTTSVDAVVAICVIFSMSFVPASFVLYLIQERVNKSKHLQFISGVSPT
1670 1680 1690 1700 1710 1720
1840 1850 1860 1870 1880 1890
pF1KA1 IYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPA
::..:..::..:: : : : :.. :. ::::: :.::...:.:::::.. :.::::
CCDS74 TYWVTNFLWDIMNYSVSAGLVVGIFIGFQKKAYTSPENLPALVALLLLYGWAVIPMMYPA
1730 1740 1750 1760 1770 1780
1900 1910 1920 1930 1940 1950
pF1KA1 SFWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNL
:: :.:::.::: : ::::::.... ::.:.:::... : :. :.. ...::.. :
CCDS74 SFLFDVPSTAYVALSCANLFIGINSSAITFILELFENNRTLLRFNAVLRKLLIVFPHFCL
1790 1800 1810 1820 1830 1840
1960 1970 1980 1990 2000 2010
pF1KA1 GHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNF
:.::...: .. ... ::..:. .. .::.::.. ..: ::.::::: ::::.. : .:
CCDS74 GRGLIDLALSQAVTDVYARFGE-EHSANPFHWDLIGKNLFAMVVEGVVYFLLTLLVQRHF
1850 1860 1870 1880 1890 1900
2020 2030 2040 2050 2060 2070
pF1KA1 -LRRPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDR
: . :.. :..: ::: ::::.. : .:......:::.: . . ::::
CCDS74 FLSQWIAEPTKEPIVDEDDDVAEERQRIITGGNKTDILRLHELTKIYPGTSSP---AVDR
1910 1920 1930 1940 1950
2080 2090 2100 2110 2120 2130
pF1KA1 LCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYC
::.:::::::::::::::::::.:::::::: ..:.:.: : :.:.: .. .:.:..:::
CCDS74 LCVGVRPGECFGLLGVNGAGKTTTFKMLTGDTTVTSGDATVAGKSILTNISEVHQNMGYC
1960 1970 1980 1990 2000 2010
2140 2150 2160 2170 2180 2190
pF1KA1 PQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKR
:: ::. . ::.:::: ::.::::. .. .:..:....: :: ::: ::::::::::
CCDS74 PQFDAIDELLTGREHLYLYARLRGVPAEEIEKVANWSIKSLGLTVYADCLAGTYSGGNKR
2020 2030 2040 2050 2060 2070
2200 2210 2220 2230 2240 2250
pF1KA1 KLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALC
:::::::::: : ...::::::::::.:::.:::.:...:. ::.:::::::::::::::
CCDS74 KLSTAIALIGCPPLVLLDEPTTGMDPQARRMLWNVIVSIIREGRAVVLTSHSMEECEALC
2080 2090 2100 2110 2120 2130
2260 2270 2280 2290 2300
pF1KA1 TRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQS-----VKDVVRFFNRNFPEAM
:::::::.: .::.:.:::::..:::::..:.. :: .. .. : .::. ::: ..
CCDS74 TRLAIMVKGAFRCMGTIQHLKSKFGDGYIVTMKIKSPKDDLLPDLNPVEQFFQGNFPGSV
2140 2150 2160 2170 2180 2190
2310 2320 2330 2340 2350 2360
pF1KA1 LKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDN
.:::.. .:.:..: :::..:. . . . : ::.:::.:::::.:::::::.:...
CCDS74 QRERHYNMLQFQVSSS--SLARIFQLLLSHKDSLLIEEYSVTQTTLDQVFVNFAKQQTES
2200 2210 2220 2230 2240 2250
2370 2380 2390 2400 2410 2420
pF1KA1 LEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQL
CCDS74 HDLPLHPRAAGASRQAQD
2260 2270
>>CCDS12055.1 ABCA7 gene_id:10347|Hs108|chr19 (2146 aa)
initn: 3904 init1: 1068 opt: 2207 Z-score: 1795.8 bits: 346.2 E(32554): 1e-93
Smith-Waterman score: 4453; 38.2% identity (63.9% similar) in 2285 aa overlap (179-2399:39-2146)
150 160 170 180 190 200
pF1KA1 FSLDSVARNPQELWRFLTQNLSLPNSTAQALLAAR-VDPPEVYHLLFGPSSALDSQSGLH
:.:.: :: .: :.. : :
CCDS12 LLLWKNFMYRRRQPVQLLVELLWPLFLFFILVAVRHSHPPLEHHECHFPNKPLPSA----
10 20 30 40 50 60
210 220 230 240 250 260
pF1KA1 KGQEPWSRLGGNPLFRMEELLLAPALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAV
: :: : : :. . : : ::: : ::. . .: . : . .:
CCDS12 -GTVPW--LQG--LICNVNNTCFPQL------TPGE-EPGRLSNFNDSLVSRLLADARTV
70 80 90 100 110
270 280 290 300 310 320
pF1KA1 CSGQAAARARRFSGLSAELRNQLDVAKVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLL
.: .: :. ..::. .: : .:. . : :. . .:: :: . :: .::
CCDS12 LGGASAHRT--LAGLG-KLIATLRAARSTAQ-----PQPTKQSPLEPPMLDVAELLTSLL
120 130 140 150 160
330 340 350 360 370
pF1KA1 ----------DAQKVLQDV-DVLSALA--LLLPQGACTGRTPGPPASGAGGAANGTGAG-
.::. :... .. :: :: .. :. :..: . . .
CCDS12 RTESLGLALGQAQEPLHSLLEAAEDLAQELLALRSLVELRALLQRPRGTSGPLELLSEAL
170 180 190 200 210 220
380 390 400 410 420 430
pF1KA1 -AVMGPNATAEEGAPSAAALATPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRR-G
.: ::..:. .:: . : .. .: .: . .. : . :
CCDS12 CSVRGPSSTV---GPSLNWYEASDLME---------LVGQEPESALPDSSLSPACSELIG
230 240 250 260 270
440 450 460 470 480 490
pF1KA1 NMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTHYAQV
..: .. : : :. :.:.:: . ... ..:.:: . . .:
CCDS12 ALDSHPLSRLLWRRLKPLIL-----GKLLFAPDTPFTRKLMAQVNRTFEELTLLRDVREV
280 290 300 310 320
500 510 520 530 540 550
pF1KA1 WLNISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQDNFSLP-SG
: .. .: .:.... :. : :. : : .:. . :.. ::: .: : ::
CCDS12 WEMLGPRIFTFMNDSSNVAMLQRLLQMQDEGRRQPRPGGR--DHME-ALR--SFLDPGSG
330 340 350 360 370 380
560 570 580 590 600
pF1KA1 MALLQQLDTIDNAACGWIQFMSK-VSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVIF
:. . . : . ... .:.: ... :.: ..:. .: : .. .:.:.:
CCDS12 GYSWQDAHADVGHLVGTLGRVTECLSLDKLEAAPSEAALVSRAL-QLLAEH-RFWAGVVF
390 400 410 420 430 440
610 620 630 640 650
pF1KA1 QTRKDGSLP---P-------HVHYKIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLY--
.:.: : : ::. :::.. . . .::.:: .: ::: . . :
CCDS12 LGPEDSSDPTEHPTPDLGPGHVRIKIRMDIDVVTRTNKIRDRFWDPGPAADPLTDLRYVW
450 460 470 480 490 500
660 670 680 690 700 710
pF1KA1 -GFVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWV
:::..::..::: . .. : . . : :.:..:::::. : :: :. . .:: ....:.
CCDS12 GGFVYLQDLVERAAVRVLSGANP-RAGLYLQQMPYPCYVDDVFLRVLSRSLPLFLTLAWI
510 520 530 540 550
720 730 740 750 760 770
pF1KA1 YSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQV
:::..:.. .: ::: ::...:..:::. :: :..::.. . . .:.. :. .:: :..
CCDS12 YSVTLTVKAVVREKETRLRDTMRAMGLSRAVLWLGWFLSCLGPFLLSAALLVLVLKLGDI
560 570 580 590 600 610
780 790 800 810 820 830
pF1KA1 LMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMY-VAIRE
: .:: ...::::..::::. ::.:...:.:.::.::::. :: :.::. :: :
CCDS12 LPYSHPGVVFLFLAAFAVATVTQSFLLSAFFSRANLAAACGGLAYFSLYLPYVLCVAWR-
620 630 640 650 660 670
840 850 860 870 880 890
pF1KA1 EVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLA
:.. : . :::.: .:::.: . .:: : : : :::. . :. .: :.: .
CCDS12 ----DRLPAGGRVAASLLSPVAFGFGCESLALLEEQGEGAQWHNVGTRPT-ADVFSLAQV
680 690 700 710 720 730
900 910 920 930 940 950
pF1KA1 VTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTP
.:..::..::. :::.::: ::.::.:.:: ::...::: : : : :
CCDS12 SGLLLLDAALYGLATWYLEAVCPGQYGIPEPWNFPFRRSYWCG-----------P--RPP
740 750 760 770 780
960 970 980 990 1000 1010
pF1KA1 RLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKLALNKLSLNLY
. : .. .:: : : : : .: : . . . :: :::..:
CCDS12 K-----SPAPCPTP---LDPKVLVEEAPPGLSPGVSVRSLEKRFPGSPQPALRGLSLDFY
790 800 810 820 830
1020 1030 1040 1050 1060 1070
pF1KA1 ENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVL
......::::::::::::.:::.:::::..::: : :::.:. : :: .::.:::.:::
CCDS12 QGHITAFLGHNGAGKTTTLSILSGLFPPSGGSAFILGHDVRSSMAAIRPHLGVCPQYNVL
840 850 860 870 880 890
1080 1090 1100 1110 1120 1130
pF1KA1 FDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAI
:: :::.::.:::.:::... . :.:....:. : .:. .. :::::.:::::::
CCDS12 FDMLTVDEHVWFYGRLKGLSAAVVGPEQDRLLQDVGLVSKQSVQTRHLSGGMQRKLSVAI
900 910 920 930 940 950
1140 1150 1160 1170 1180 1190
pF1KA1 AFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIIS
::::::...::::::::::: .::.::.:.:::. :::..:::::.:::.:::::.:...
CCDS12 AFVGGSQVVILDEPTAGVDPASRRGIWELLLKYREGRTLILSTHHLDEAELLGDRVAVVA
960 970 980 990 1000 1010
1200 1210 1220 1230 1240 1250
pF1KA1 HGKLKCCGSPLFLKGTYGDGYRLTLVKR--PAEPGGPQEPGLASSPPGRAPLSSCSEL--
:.: ::::::::. :.:: ::::: : . . . .: : .. :.
CCDS12 GGRLCCCGSPLFLRRHLGSGYYLTLVKARLPLTTNEKADTDMEGSVDTRQEKKNGSQGSR
1020 1030 1040 1050 1060 1070
1260 1270 1280 1290 1300
pF1KA1 ----QVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSF
:. .... : . :: . :: .:: .:. :.: :::.:. : :.:...
CCDS12 VGTPQLLALVQHWVPGARLVEELPHELVLVLPYTGAHDGSFATLFRELDTRLAELRLTGY
1080 1090 1100 1110 1120 1130
1310 1320 1330 1340 1350 1360
pF1KA1 GLMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAG-NLARCSELT
:. ::.:::.:::: :: ::. :. :. : : :: ... ..
CCDS12 GISDTSLEEIFLKVVEE------CAADT-----DMEDGSCGQHLCTGIAGLDVTLRLKMP
1140 1150 1160 1170 1180
1370 1380 1390 1400 1410 1420
pF1KA1 QSQASLQSASSVGSA-RGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQG
....:... .::: . :.:.: :: :. .:.. ::.:
CCDS12 PQETALENGEPAGSAPETDQGSG-----------------PDAVG--RVQGWALTR----
1190 1200 1210
1430 1440 1450 1460 1470 1480
pF1KA1 SRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLP
.:...::.::: :::. ..::.::.:::.:: .:.. .: :: .: :
CCDS12 -----------QQLQALLLKRFLLARRSRRGLFAQIVLPALFVGLALVFSLIVPPFGHYP
1220 1230 1240 1250 1260
1490 1500 1510 1520 1530 1540
pF1KA1 PLVLSPSQYHNYTQPRGNFIPYANEERR--EYRLRLSPDASPQQLVSTFRLPSGVGATCV
: :::..: .. .. : . : : :. . : :. :. . . :
CCDS12 ALRLSPTMYGAQVSFFSEDAPGDPGRARLLEALLQEAGLEEPPVQHSSHRFSAPEVPAEV
1270 1280 1290 1300 1310 1320
1550 1560 1570 1580 1590 1600
pF1KA1 LKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPAS
: :.:. : . . .:: . : : . ::::. . ... .
CCDS12 AKVLASGNWTPESPSPACQCSRPGARRLLPDC--------PAAAGGPPPPQAVTGSGEVV
1330 1340 1350 1360 1370
1610 1620 1630 1640 1650 1660
pF1KA1 PDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRC---TCSAQGTGFSCPSSVGGHPP
..: . :.: . . :::::. .. . .. ::: .::. :
CCDS12 --QNLTGRNLSD---------FLVKTYPRLVRQGLKTKKWVNEVRYGGFS----LGGRDP
1380 1390 1400 1410 1420
1670 1680 1690 1700 1710 1720
pF1KA1 QMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRK
. .:. : :..: : . : ::. :::.. : ...
CCDS12 GL--PSGQEL----GRSVEELWALLSPL----PGGAL--DRVLKNLTA--------WAHS
1430 1440 1450 1460
1730 1740 1750 1760 1770
pF1KA1 IAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPA--AYGITVTNHPMNKTS
. .. . ....::::.::: ...: .::::::.:: . :: :..::. :::.: :.
CCDS12 LDAQDSLKIWFNNKGWHSMVAFVNRASNAILRAHLPPG---PARHAHSITTLNHPLNLTK
1470 1480 1490 1500 1510 1520
1780 1790 1800 1810 1820 1830
pF1KA1 ASLSLDYLLQGT-DVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWL
.:: :. .. ::...: .. :::::::::.. :. :. :.:::::...: .: .:::
CCDS12 EQLSEGALMASSVDVLVSICVVFAMSFVPASFTLVLIEERVTRAKHLQLMGGLSPTLYWL
1530 1540 1550 1560 1570 1580
1840 1850 1860 1870 1880 1890
pF1KA1 ANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWF
.:..::: :::::: :.:...:. ::..:.:.::.: :.:::::::::.::::::.:
CCDS12 GNFLWDMCNYLVPACIVVLIFLAFQQRAYVAPANLPALLLLLLLYGWSITPLMYPASFFF
1590 1600 1610 1620 1630 1640
1900 1910 1920 1930 1940 1950
pF1KA1 EVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGL
:::.::: : :::::::....:::.:.:: :. :. :. ::. :::::.. ::.::
CCDS12 SVPSTAYVVLTCINLFIGINGSMATFVLELFS-DQKLQEVSRILKQVFLIFPHFCLGRGL
1650 1660 1670 1680 1690 1700
1960 1970 1980 1990 2000 2010
pF1KA1 MEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRP
..:. :. . . . ..:. ...::..:..: ..:.::...: . .:.:.. :. :
CCDS12 IDMVRNQAMADAFERLGD-RQFQSPLRWEVVGKNLLAMVIQGPLFLLFTLLLQH----RS
1710 1720 1730 1740 1750
2020 2030 2040 2050 2060 2070
pF1KA1 QRMP---VSTKPV--EDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDR
: .: : . :. :.: ::: ::.::..: ...:.. ..::::::... :. ::::
CCDS12 QLLPQPRVRSLPLLGEEDEDVARERERVVQGATQGDVLVLRNLTKVYRGQ---RMPAVDR
1760 1770 1780 1790 1800 1810
2080 2090 2100 2110 2120 2130
pF1KA1 LCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYC
::::. :::::::::::::::::::.:.::: .. ::: . :::: .: .. :.:::
CCDS12 LCLGIPPGECFGLLGVNGAGKTSTFRMVTGDTLASRGEAVLAGHSVAREPSAAHLSMGYC
1820 1830 1840 1850 1860 1870
2140 2150 2160 2170 2180 2190
pF1KA1 PQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKR
:: ::.:. ::.::::.: .::::. . :... .: .: :. :::.:::::::::::
CCDS12 PQSDAIFELLTGREHLELLARLRGVPEAQVAQTAGSGLARLGLSWYADRPAGTYSGGNKR
1880 1890 1900 1910 1920 1930
2200 2210 2220 2230 2240 2250
pF1KA1 KLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALC
::.::.::.: :: .:::::::::::.::::::: .: ... ::::.:::::::::::::
CCDS12 KLATALALVGDPAVVFLDEPTTGMDPSARRFLWNSLLAVVREGRSVMLTSHSMEECEALC
1940 1950 1960 1970 1980 1990
2260 2270 2280 2290 2300 2310
pF1KA1 TRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDVVRFFNRNFPEAMLKERH
.:::::::::.::::: ::::.::. :. .:.:. ...: . .. : .:: : :.: :
CCDS12 SRLAIMVNGRFRCLGSPQHLKGRFAAGHTLTLRVPAARS-QPAAAFVAAEFPGAELREAH
2000 2010 2020 2030 2040 2050
2320 2330 2340 2350 2360
pF1KA1 HTKVQYQLK-SEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQS---DNL
....:: . . .::.::... .. :.::.::::: :..::. :.: :. :.
CCDS12 GGRLRFQLPPGGRCALARVFGELAVHGAEHGVEDFSVSQTMLEEVFLYFSKDQGKDEDTE
2060 2070 2080 2090 2100 2110
2370 2380 2390 2400 2410 2420
pF1KA1 EQQET----EPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEER
::.:. .: .:: : : : .: : :
CCDS12 EQKEAGVGVDPAPGLQHPKRVSQFLDDPSTAETVL
2120 2130 2140
2430
pF1KA1 AQLSFNTDTLC
>>CCDS47584.1 ABCA13 gene_id:154664|Hs108|chr7 (5058 aa)
initn: 2410 init1: 626 opt: 1627 Z-score: 1317.5 bits: 258.9 E(32554): 4.6e-67
Smith-Waterman score: 3293; 33.1% identity (64.0% similar) in 1958 aa overlap (458-2377:3317-5047)
430 440 450 460 470 480
pF1KA1 LRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTH
::::.: :...:: ::: :: .: ..
CCDS47 TPFCLKLYQEILQLPNGALVWTFLKPILHGKILYTPNTPEINKVIQKANYTFYIVDKLKT
3290 3300 3310 3320 3330 3340
490 500 510 520 530 540
pF1KA1 YAQVWLNISAKI-RSFLEQ--GRLQQHLR--WLQQYVAELRLHPEALNLSLDELPPALRQ
... :..:. . :: : ..::. :: .....: : .:: ...:.: :.
CCDS47 LSETLLEMSSLFQRSGSGQMFNQLQEALRNKFVRNFV-ENQLH-----IDVDKLTEKLQT
3350 3360 3370 3380 3390 3400
550 560 570 580 590
pF1KA1 DNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDI-----FKGFPDEES--IVNYTLNQ
. .::... ...:. : ..:.... :.. .. : .: :.. ..
CCDS47 YG-------GLLDEM--FNHAGAGRFRFLGSILVNLSSCVALNRFQALQSVDILETKAHE
3410 3420 3430 3440 3450
600 610 620 630 640
pF1KA1 AYQDNVTVFASVIFQT-------RKDG-SLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGP
:.: . .::.::.. :... .::::: : :: : .. .:. .. :. :
CCDS47 LLQQN-SFLASIIFSNSLFDKNFRSESVKLPPHVSYTIRTNVLYSVRTDVVKNPSWKFHP
3460 3470 3480 3490 3500 3510
650 660 670 680 690 700
pF1KA1 NT--GGRFYFLYGFVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEH
.. . : . : :. .:::.::::: . .:....::.. .: ::::.: : :: .
CCDS47 QNLPADGFKYNYVFAPLQDMIERAIILVQTGQEALEPAAQTQAAPYPCHTSDLFLNNVGF
3520 3530 3540 3550 3560 3570
710 720 730 740 750 760
pF1KA1 MMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVT
..:: :...:. ::: ....: :.: ...: :. ::.. ..:..:::. ... :.:: .
CCDS47 FFPLIMMLTWMVSVASMVRKLVYEQEIQIEEYMRMMGVHPVIHFLAWFLENMAVLTISSA
3580 3590 3600 3610 3620 3630
770 780 790 800 810 820
pF1KA1 ALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSY
.:. .:: . .. ::.. :..::: ......:. .:.:...:.:. :. : ...:..:.
CCDS47 TLAIVLKTSGIFAHSNTFIVFLFLLDFGMSVVMLSYLLSAFFSQANTAALCTSLVYMISF
3640 3650 3660 3670 3680 3690
830 840 850 860 870 880
pF1KA1 VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPV
.::. . : :.... .. . :.:::::: : .... : .::::... :. .
CCDS47 LPYIVLL----VLHNQLSFVNQTFLCLLSTTAFGQGVFFITFLEGQETGIQWNNMYQA-L
3700 3710 3720 3730 3740
890 900 910 920 930 940
pF1KA1 EGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAW
: ... . :.. :. .: . ::. . :: .:: .:::::. ::: . :
CCDS47 EQGGMTFGWVCWMILFDSSLYFLCGWYLSNLIPGTFGLRKPWYFPFTASYWKSVGFLVEK
3750 3760 3770 3780 3790 3800
950 960 970 980 990 1000
pF1KA1 EWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDDKKL
. . . .. .... ....:. : .: . :: ..:: : . .:
CCDS47 RQYFLSSSLFFFNENFDNKGSSLQNREGE----LEGSAPGVTLV----SVTKEY-EGHKA
3810 3820 3830 3840 3850
1010 1020 1030 1040 1050 1060
pF1KA1 ALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKN
... :::..:..:....:: ::::::: .:.:::: :::::. : :....:.....: .
CCDS47 VVQDLSLTFYRDQITALLGTNGAGKTTIISMLTGLHPPTSGTIIINGKNLQTDLSRVRME
3860 3870 3880 3890 3900 3910
1070 1080 1090 1100 1110 1120
pF1KA1 LGMCPQHNVLFDRLTVEEHLWFYSRLKS--MAQEEIRREMDKMIEDLELSNKRHSLVQTL
::.:::...:.: :::.::: ... .:. ...:....... ..:..:....:. ...:
CCDS47 LGVCPQQDILLDNLTVREHLLLFASIKAPQWTKKELHQQVNQTLQDVDLTQHQHKQTRAL
3920 3930 3940 3950 3960 3970
1130 1140 1150 1160 1170 1180
pF1KA1 SGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDE
:::.:::::..:::.: ::...:::::.:::: .:...::..:::. ::::...:::.::
CCDS47 SGGLKRKLSLGIAFMGMSRTVVLDEPTSGVDPCSRHSLWDILLKYREGRTIIFTTHHLDE
3980 3990 4000 4010 4020 4030
1190 1200 1210 1220 1230 1240
pF1KA1 ADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRA
:. :.::.:...::.:.::: :. :: .::.: ::::...:. . . .:
CCDS47 AEALSDRVAVLQHGRLRCCGPPFCLKEAYGQGLRLTLTRQPSVLEAHDLKDMA-------
4040 4050 4060 4070 4080
1250 1260 1270 1280 1290 1300
pF1KA1 PLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALH
: :...:. .. . .: .....::.: .:... :. .. ::. :...: ::
CCDS47 ----C----VTSLIKIYIPQAFLKDSSGSELTYTIPKDT-DKACLKGLFQALDENLHQLH
4090 4100 4110 4120 4130 4140
1310 1320 1330 1340 1350 1360
pF1KA1 LSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCS
:...:. ::::::::: . ... :... . . .. : . . . :. :.:::
CCDS47 LTGYGISDTTLEEVFLMLLQDS----NKKSHIALGTESELQNHRPTGHLSGYCGSLAR--
4150 4160 4170 4180 4190
1370 1380 1390 1400 1410 1420
pF1KA1 ELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVG
: .:
CCDS47 ------------------------------------------PATV--------------
1430 1440 1450 1460 1470 1480
pF1KA1 QGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGD
:: . : . : ..:..:.. . : .:. ....:::..:: .:: . . : .
CCDS47 QGVQLLRA------QVAAILARRLRRTLRAGKSTLADLLLPVLFVALAMGLFMVRPLATE
4200 4210 4220 4230 4240 4250
1490 1500 1510 1520 1530 1540
pF1KA1 LPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCV
::: :.:..: .: : :. . ::
CCDS47 YPPLRLTPGHY----------------QRAE----------------TYFFSSG------
4260 4270
1550 1560 1570 1580 1590 1600
pF1KA1 LKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPAS
: .:.:. :.: .: : : :: ... .: ..:
CCDS47 ---------GDNLDLT----RVLLRKFRD--------QDLPCADL-----NPRQKNS---
4280 4290 4300
1610 1620 1630 1640 1650 1660
pF1KA1 PDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMR
. : .. : . ::. : : : ..::. .. : .
CCDS47 -----SCWRTD--PFSHPEFQDS-------------CGC------LKCPNR-SASAPYLT
4310 4320 4330
1670 1680 1690 1700 1710 1720
pF1KA1 VVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAV
: : ...: :. :::: :.. :: :. .:: :: ::. : . . ..
CCDS47 NHLGHTLLNLSGFNMEEYLLAPSEKPRL---GGWSFG--LK-IPSEAGGANGNISKPPTL
4340 4350 4360 4370 4380 4390
1730 1740 1750 1760 1770 1780
pF1KA1 RRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSL
:.:.::.::.::.:.::: ::: :: .:: . . ::::. .::.. .: :.
CCDS47 ---AKVWYNQKGFHSLPSYLNHLNNLILWQHLPPTV-DWRQYGITLYSHPYG--GALLNE
4400 4410 4420 4430 4440
1790 1800 1810 1820 1830 1840
pF1KA1 DYLLQGT-DVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVW
: .:.. . .:. :....:.. ::. .: .. ::.:: .:: . .::..:...
CCDS47 DKILESIRQCGVALCIVLGFSILSASIGSSVVRDRVIGAKRLQHISGLGYRMYWFTNFLY
4450 4460 4470 4480 4490 4500
1850 1860 1870 1880 1890 1900
pF1KA1 DMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSS
::: ::: . :: .. .:.: :.: :. :. :. :.:.. : :: : : .
CCDS47 DMLFYLVSVCLCVAVIVAFQLTAFTFRKNLAATALLLSLFGYATLPWMYLMSRIFSSSDV
4510 4520 4530 4540 4550 4560
1910 1920 1930 1940 1950
pF1KA1 AYVFLIVINLFIGITATVATF---LLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLME
:.. . .:...:. . . :. :: .. . :.:. . . :: : :::.. ::.::.:
CCDS47 AFISYVSLNFIFGLCTMLITIMPRLLAIISKAKNLQNIYDVLKWVFTIFPQFCLGQGLVE
4570 4580 4590 4600 4610 4620
1960 1970 1980 1990 2000 2010
pF1KA1 MAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQR
. ::. . ..: .:.. :::: ... .: .: .:.: .:: .. ....:: :.
CCDS47 LCYNQIKYDLTHNFG-IDSYVSPFEMNFLGWIFVQLASQGTVLLLLRVLLHWDLLRWPRG
4630 4640 4650 4660 4670 4680
2020 2030 2040 2050 2060 2070
pF1KA1 MPVSTKPVED--DVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRLCLGV
. :.. :.:: .:..::..: ...:.. . ::.: :. : . :.::. . ::.
CCDS47 HSTLQGTVKSSKDTDVEKEEKRVFEGRTNGDILVLYNLSKHYR-RFFQNIIAVQDISLGI
4690 4700 4710 4720 4730 4740
2080 2090 2100 2110 2120 2130
pF1KA1 RPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVN---GHSV-LKELLQVQQSLGYCP
::::::::::::::..:::::.:. : :.:.:.. : .: :. . .::::
CCDS47 PKGECFGLLGVNGAGKSTTFKMLNGEVSLTSGHAIIRTPMGDAVDLSSAGTAGVLIGYCP
4750 4760 4770 4780 4790 4800
2140 2150 2160 2170 2180 2190
pF1KA1 QCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKRK
: ::: . ::. ::: : :::: . .:. ...:.: .::::..:::::.:::
CCDS47 QQDALDELLTGWEHLYYYCSLRGIPRQCIPEVAGDLIRRLHLEAHADKPVATYSGGTKRK
4810 4820 4830 4840 4850 4860
2200 2210 2220 2230 2240 2250
pF1KA1 LSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALCT
::::.::.: : ...::::..:::: ..:.::. :. .. : ..:::::::::::::::
CCDS47 LSTALALVGKPDILLLDEPSSGMDPCSKRYLWQTIMKEVREGCAAVLTSHSMEECEALCT
4870 4880 4890 4900 4910 4920
2260 2270 2280 2290 2300
pF1KA1 RLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRT--KSSQ--SVKDVVRFFNRNFPEAMLK
:::::::: ..:::: ::.:::::::: . : ...: .:.: .... :: ..:
CCDS47 RLAIMVNGSFKCLGSPQHIKNRFGDGYTVKVWLCKEANQHCTVSDHLKLY---FPGIQFK
4930 4940 4950 4960 4970 4980
2310 2320 2330 2340 2350 2360
pF1KA1 ERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNLE
.: . ..:.. .. ::..:. .:. . :.:. ::..::::..::.:::..:...:
CCDS47 GQHLNLLEYHVPKRWGCLADLFKVIENNKTFLNIKHYSINQTTLEQVFINFASEQQQTL-
4990 5000 5010 5020 5030 5040
2370 2380 2390 2400 2410 2420
pF1KA1 QQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSF
: : ::
CCDS47 -QSTLDPSTDSHHTHHLPI
5050
>>CCDS33373.1 ABCA12 gene_id:26154|Hs108|chr2 (2277 aa)
initn: 2275 init1: 608 opt: 1396 Z-score: 1134.4 bits: 223.9 E(32554): 7.3e-57
Smith-Waterman score: 3505; 34.3% identity (65.1% similar) in 1950 aa overlap (458-2364:490-2251)
430 440 450 460 470 480
pF1KA1 LRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTH
.::::: . . .. :.: :. .... .
CCDS33 TPFCFSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELRE
460 470 480 490 500 510
490 500 510 520 530
pF1KA1 YAQVWLNISAK-IRSF--LEQG--RLQQHLR--WLQQYVAELRLHPEALNL--SLDELPP
.: :.. : . :: :.:. ::. :: ..: .: .. . .:..: ..:::
CCDS33 KSQEWMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFV-KFSVGLDAVELLKQIDELD-
520 530 540 550 560 570
540 550 560 570 580 590
pF1KA1 ALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQ
:: ..: ... ...::.:... . ... : : : ... . . . .. :.
CCDS33 ILR---LKLENNIDIIDQLNTLSSLT---VNISSCVLYDRIQAAKTIDEM-EREAKRLYK
580 590 600 610 620 630
600 610 620 630 640
pF1KA1 DNVTVFASVIFQTRKDGS-----------LPPHVHYKIRQNSSFTEKTNEIRRAYWRPGP
.: .:.::::. .. : ::: ..: ::.. . .. : .: : :::
CCDS33 SN-ELFGSVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGP
640 650 660 670 680
650 660 670 680 690 700
pF1KA1 NTGGRFYFLYG--FVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEH
... .:: :...:: .:::::. .:.. : . :: .::::. .:.:: . .
CCDS33 HNSPSHNQIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSY
690 700 710 720 730 740
710 720 730 740 750 760
pF1KA1 MMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVT
.:. ....:: .: ....: ::. ::.: :: ::.:. :. ::.: . : ....
CCDS33 SLPIVLMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIV
750 760 770 780 790 800
770 780 790 800 810 820
pF1KA1 ALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSY
: :::.:..: ... :..:... :. ..: . .:.::.......:. :..::....
CCDS33 ILIIILKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAF
810 820 830 840 850 860
830 840 850 860 870 880
pF1KA1 VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPV
:.. .. : .... : . ::.: :::. .:.:.: :: :.:.::... :::
CCDS33 FPFIVLVTVE----NELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPV
870 880 890 900 910 920
890 900 910 920 930 940
pF1KA1 EGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYW---LGSGRT
. : .. ....:. .: ...::.. : :: ::. :::::. ::: .: ...
CCDS33 QDDTTSFGWLCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEV
930 940 950 960 970 980
950 960 970 980 990 1000
pF1KA1 EAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDD
. : : : ..: .. . : .. . ..: :: : . : . .::.:
CCDS33 KP-EKSNGLMFT---NIMMQNTNPSA-SPEYMFSSNIEPEPKDLTVGVALHGVTKIY--G
990 1000 1010 1020 1030
1010 1020 1030 1040 1050 1060
pF1KA1 KKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEI
.:.:...:.::.::....:.:: ::::::::.:.::::: ..:. .::.::.:.. .
CCDS33 SKVAVDNLNLNFYEGHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTV
1040 1050 1060 1070 1080 1090
1070 1080 1090 1100 1110 1120
pF1KA1 RKNLGMCPQHNVLFDRLTVEEHLWFYSRLK--SMAQEEIRREMDKMIEDLELSNKRHSLV
:::.:.: ::.:::. ::..::: .:. .: .......:. . ..: : ..::. :
CCDS33 RKNMGVCMQHDVLFSYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRV
1100 1110 1120 1130 1140 1150
1130 1140 1150 1160 1170 1180
pF1KA1 QTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHH
:::::::::::..::..::::..:::::..:::: .::.:::.: : : .:::.:::::
CCDS33 GTLSGGMKRKLSISIALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHH
1160 1170 1180 1190 1200 1210
1190 1200 1210 1220 1230 1240
pF1KA1 MDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPP
.:::..:.::::.. .: :.:::::..:: ..::::.:::.:. . :.: ..
CCDS33 LDEAEVLSDRIAFLEQGGLRCCGSPFYLKEAFGDGYHLTLTKK-------KSPNLNAN--
1220 1230 1240 1250 1260
1250 1260 1270 1280 1290
pF1KA1 GRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAK-KGAFERLFRHLERSL
. :. . :. .:..:. : : . :: :.:: ..: .::. :.: :. ..
CCDS33 -----AVCDTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDNGM
1270 1280 1290 1300 1310 1320
1300 1310 1320 1330 1340 1350
pF1KA1 DALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKE-SRKDVLPGAEGPASGEGHAGN
:... .:. :::.:::::....:.: .:: .... ..: . :...:..
CCDS33 GDLNIGCYGISDTTVEEVFLNLTKESQ--KNSAMSLEHLTQKKI---------GNSNANG
1330 1340 1350 1360 1370
1360 1370 1380 1390 1400 1410
pF1KA1 LARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEA
.. ..: ::.: ...:: .: :..
CCDS33 ISTPDDL-----------SVSS------SNFTD------------RD-DKI---------
1380 1390
1420 1430 1440 1450 1460 1470
pF1KA1 LSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSV
:.: : : ::: : .... ..:.:::: .::: :.:..:..:: :: .:: ..
CCDS33 LTR---GER-LDGFGLLLKKIMAILIKRFHHTRRNWKGLIAQVILPIVFVTTAMGLGTLR
1400 1410 1420 1430 1440 1450
1480 1490 1500 1510 1520 1530
pF1KA1 PEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGV
.. : . .::: : . : : ::: :. : : . :::.. :.
CCDS33 NSSNSYPEIQISPSLYGTSEQT--AF--YAN-----YH----P--STEALVSAMWDFPGI
1460 1470 1480 1490
1540 1550 1560 1570 1580 1590
pF1KA1 GATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPS
: :: : : .::..
CCDS33 DNMC-------------LNTS------------DLQCLNK--------------------
1500 1510
1600 1610 1620 1630 1640 1650
pF1KA1 DSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGH
:: :. ::.: : .. . :.:: . ::. .
CCDS33 DS-------LEKWNTSGEPITNFGV----------------CSCSENVQ--ECPK-FNYS
1520 1530 1540
1660 1670 1680 1690 1700 1710
pF1KA1 PPQMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMV
::. :. ..... ..::. : .::. :...: .:::. .:: : . : . :
CCDS33 PPHRRTYSSQVIYNLTGQRVENYLISTANEFVQKRYGGWSFGLPL-TKDLRFDITGVP--
1550 1560 1570 1580 1590 1600
1720 1730 1740 1750 1760 1770
pF1KA1 RKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMN--K
: : :.:.:. .::::.:.::::::: .::.:. :: . : .:: . .::. .
CCDS33 ---ANRTLAKVWYDPEGYHSLPAYLNSLNNFLLRVNM--SKYDAARHGIIMYSHPYPGVQ
1610 1620 1630 1640 1650
1780 1790 1800 1810 1820 1830
pF1KA1 TSASLSLDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYW
. . ... :. :...:. :....: . ::::...: :..::::.:: .:: . ::
CCDS33 DQEQATISSLI---DILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYW
1660 1670 1680 1690 1700 1710
1840 1850 1860 1870 1880 1890
pF1KA1 LANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFW
..:...::. ::::.. . :. .: :::. : .:. :: :.::.:.. :: .
CCDS33 VTNFIYDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGL
1720 1730 1740 1750 1760 1770
1900 1910 1920 1930 1940 1950
pF1KA1 FEVPSSAYVFLIVINLFIGITA----TVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYN
:. . :.. . .:::.::.. .:. :: . .: :.... :: :::::..
CCDS33 FHETGMAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFC
1780 1790 1800 1810 1820 1830
1960 1970 1980 1990 2000 2010
pF1KA1 LGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYN
.:.::.:.. .. . .. : . . :: . . .::.. .:.. : : .. . .
CCDS33 FGYGLIELSQQQSVLDFLKAYG-VEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINES
1840 1850 1860 1870 1880 1890
2020 2030 2040 2050 2060
pF1KA1 FLRRPQ---RMPVST---KPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGR
.... . : :. . ...: :: .:: :: : :. :.:.. :::.:. . .
CCDS33 LIKKLRLFFRKFNSSHVRETIDEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIH-KK
1900 1910 1920 1930 1940 1950
2070 2080 2090 2100 2110 2120
pF1KA1 ILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQ
:.::. . .:. :::::::::::::::. ::::::: ..:. .. ... .. .
CCDS33 IIAVNNISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSH
1960 1970 1980 1990 2000 2010
2130 2140 2150 2160 2170 2180
pF1KA1 QSL-GYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGT
.:: ::::: ::: : .:..::: .:.:..:: :: ..:. :..:.: . :. ..
CCDS33 SSLVGYCPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSM
2020 2030 2040 2050 2060 2070
2190 2200 2210 2220 2230 2240
pF1KA1 YSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSM
: :.:::::::.:::: :....::::..:::::..: ::..: . ... ::.::::::
CCDS33 CSYGTKRKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSM
2080 2090 2100 2110 2120 2130
2250 2260 2270 2280 2290 2300
pF1KA1 EECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQ-SVKDVVRFFNRNFP
::::::::::::::::...:.::.::.:.::: :. . :. :... ... ...:.. .::
CCDS33 EECEALCTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNKVTMETLTKFMQLHFP
2140 2150 2160 2170 2180 2190
2310 2320 2330 2340 2350 2360
pF1KA1 EAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQ
...::..: . ..:.. ..:..:. .: . .:.: .. ::::::..::.:::: :
CCDS33 KTYLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQ
2200 2210 2220 2230 2240 2250
2370 2380 2390 2400 2410 2420
pF1KA1 SDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEER
CCDS33 KSYETADTSSQGSTISVDSQDDQMES
2260 2270
>>CCDS33372.1 ABCA12 gene_id:26154|Hs108|chr2 (2595 aa)
initn: 2599 init1: 608 opt: 1396 Z-score: 1133.5 bits: 223.9 E(32554): 8.1e-57
Smith-Waterman score: 3505; 34.3% identity (65.1% similar) in 1950 aa overlap (458-2364:808-2569)
430 440 450 460 470 480
pF1KA1 LRRGNMSSLGFTSKEQRNLGLLVHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTH
.::::: . . .. :.: :. .... .
CCDS33 TPFCFSLYKDIINMPAGPVIWAFLKPMLLGRILYAPYNPVTKAIMEKSNVTLRQLAELRE
780 790 800 810 820 830
490 500 510 520 530
pF1KA1 YAQVWLNISAK-IRSF--LEQG--RLQQHLR--WLQQYVAELRLHPEALNL--SLDELPP
.: :.. : . :: :.:. ::. :: ..: .: .. . .:..: ..:::
CCDS33 KSQEWMDKSPLFMNSFHLLNQAIPMLQNTLRNPFVQVFV-KFSVGLDAVELLKQIDELD-
840 850 860 870 880 890
540 550 560 570 580 590
pF1KA1 ALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQ
:: ..: ... ...::.:... . ... : : : ... . . . .. :.
CCDS33 ILR---LKLENNIDIIDQLNTLSSLT---VNISSCVLYDRIQAAKTIDEM-EREAKRLYK
900 910 920 930 940
600 610 620 630 640
pF1KA1 DNVTVFASVIFQTRKDGS-----------LPPHVHYKIRQNSSFTEKTNEIRRAYWRPGP
.: .:.::::. .. : ::: ..: ::.. . .. : .: : :::
CCDS33 SN-ELFGSVIFKLPSNRSWHRGYDSGNVFLPPVIKYTIRMSLKTAQTTRSLRTKIWAPGP
950 960 970 980 990 1000
650 660 670 680 690 700
pF1KA1 NTGGRFYFLYG--FVWIQDMMERAIIDTFVGHDVVEPGSYVQMFPYPCYTRDDFLFVIEH
... .:: :...:: .:::::. .:.. : . :: .::::. .:.:: . .
CCDS33 HNSPSHNQIYGRAFIYLQDSIERAIIELQTGRNSQEIAVQVQAIPYPCFMKDNFLTSVSY
1010 1020 1030 1040 1050 1060
710 720 730 740 750 760
pF1KA1 MMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVT
.:. ....:: .: ....: ::. ::.: :: ::.:. :. ::.: . : ....
CCDS33 SLPIVLMVAWVVFIAAFVKKLVYEKDLRLHEYMKMMGVNSCSHFFAWLIESVGFLLVTIV
1070 1080 1090 1100 1110 1120
770 780 790 800 810 820
pF1KA1 ALTAILKYGQVLMHSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSY
: :::.:..: ... :..:... :. ..: . .:.::.......:. :..::....
CCDS33 ILIIILKFGNILPKTNGFILFLYFSDYSFSVIAMSYLISVFFNNTNIAALIGSLIYIIAF
1130 1140 1150 1160 1170 1180
830 840 850 860 870 880
pF1KA1 VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPV
:.. .. : .... : . ::.: :::. .:.:.: :: :.:.::... :::
CCDS33 FPFIVLVTVE----NELSYVLKVFMSLLSPTAFSYASQYIARYEEQGIGLQWENMYTSPV
1190 1200 1210 1220 1230 1240
890 900 910 920 930 940
pF1KA1 EGDDFNLLLAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYW---LGSGRT
. : .. ....:. .: ...::.. : :: ::. :::::. ::: .: ...
CCDS33 QDDTTSFGWLCCLILADSFIYFLIAWYVRNVFPGTYGMAAPWYFPILPSYWKERFGCAEV
1250 1260 1270 1280 1290 1300
950 960 970 980 990 1000
pF1KA1 EAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVYKDD
. : : : ..: .. . : .. . ..: :: : . : . .::.:
CCDS33 KP-EKSNGLMFT---NIMMQNTNPSA-SPEYMFSSNIEPEPKDLTVGVALHGVTKIY--G
1310 1320 1330 1340 1350
1010 1020 1030 1040 1050 1060
pF1KA1 KKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEI
.:.:...:.::.::....:.:: ::::::::.:.::::: ..:. .::.::.:.. .
CCDS33 SKVAVDNLNLNFYEGHITSLLGPNGAGKTTTISMLTGLFGASAGTIFVYGKDIKTDLHTV
1360 1370 1380 1390 1400 1410
1070 1080 1090 1100 1110 1120
pF1KA1 RKNLGMCPQHNVLFDRLTVEEHLWFYSRLK--SMAQEEIRREMDKMIEDLELSNKRHSLV
:::.:.: ::.:::. ::..::: .:. .: .......:. . ..: : ..::. :
CCDS33 RKNMGVCMQHDVLFSYLTTKEHLLLYGSIKVPHWTKKQLHEEVKRTLKDTGLYSHRHKRV
1420 1430 1440 1450 1460 1470
1130 1140 1150 1160 1170 1180
pF1KA1 QTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHH
:::::::::::..::..::::..:::::..:::: .::.:::.: : : .:::.:::::
CCDS33 GTLSGGMKRKLSISIALIGGSRVVILDEPSTGVDPCSRRSIWDVISKNKTARTIILSTHH
1480 1490 1500 1510 1520 1530
1190 1200 1210 1220 1230 1240
pF1KA1 MDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPP
.:::..:.::::.. .: :.:::::..:: ..::::.:::.:. . :.: ..
CCDS33 LDEAEVLSDRIAFLEQGGLRCCGSPFYLKEAFGDGYHLTLTKK-------KSPNLNAN--
1540 1550 1560 1570 1580
1250 1260 1270 1280 1290
pF1KA1 GRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAK-KGAFERLFRHLERSL
. :. . :. .:..:. : : . :: :.:: ..: .::. :.: :. ..
CCDS33 -----AVCDTMAVTAMIQSHLPEAYLKEDIGGELVYVLPPFSTKVSGAYLSLLRALDNGM
1590 1600 1610 1620 1630 1640
1300 1310 1320 1330 1340 1350
pF1KA1 DALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKE-SRKDVLPGAEGPASGEGHAGN
:... .:. :::.:::::....:.: .:: .... ..: . :...:..
CCDS33 GDLNIGCYGISDTTVEEVFLNLTKESQ--KNSAMSLEHLTQKKI---------GNSNANG
1650 1660 1670 1680 1690
1360 1370 1380 1390 1400 1410
pF1KA1 LARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEA
.. ..: ::.: ...:: .: :..
CCDS33 ISTPDDL-----------SVSS------SNFTD------------RD-DKI---------
1700 1710
1420 1430 1440 1450 1460 1470
pF1KA1 LSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSV
:.: : : ::: : .... ..:.:::: .::: :.:..:..:: :: .:: ..
CCDS33 LTR---GER-LDGFGLLLKKIMAILIKRFHHTRRNWKGLIAQVILPIVFVTTAMGLGTLR
1720 1730 1740 1750 1760
1480 1490 1500 1510 1520 1530
pF1KA1 PEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGV
.. : . .::: : . : : ::: :. : : . :::.. :.
CCDS33 NSSNSYPEIQISPSLYGTSEQT--AF--YAN-----YH----P--STEALVSAMWDFPGI
1770 1780 1790 1800 1810
1540 1550 1560 1570 1580 1590
pF1KA1 GATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPS
: :: : : .::..
CCDS33 DNMC-------------LNTS------------DLQCLNK--------------------
1820
1600 1610 1620 1630 1640 1650
pF1KA1 DSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGH
:: :. ::.: : .. . :.:: . ::. .
CCDS33 DS-------LEKWNTSGEPITNFGV----------------CSCSENVQ--ECPK-FNYS
1830 1840 1850 1860
1660 1670 1680 1690 1700 1710
pF1KA1 PPQMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMV
::. :. ..... ..::. : .::. :...: .:::. .:: : . : . :
CCDS33 PPHRRTYSSQVIYNLTGQRVENYLISTANEFVQKRYGGWSFGLPL-TKDLRFDITGVP--
1870 1880 1890 1900 1910
1720 1730 1740 1750 1760 1770
pF1KA1 RKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMN--K
: : :.:.:. .::::.:.::::::: .::.:. :: . : .:: . .::. .
CCDS33 ---ANRTLAKVWYDPEGYHSLPAYLNSLNNFLLRVNM--SKYDAARHGIIMYSHPYPGVQ
1920 1930 1940 1950 1960 1970
1780 1790 1800 1810 1820 1830
pF1KA1 TSASLSLDYLLQGTDVVIAIFIIVAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYW
. . ... :. :...:. :....: . ::::...: :..::::.:: .:: . ::
CCDS33 DQEQATISSLI---DILVALSILMGYSVTTASFVTYVVREHQTKAKQLQHISGIGVTCYW
1980 1990 2000 2010 2020 2030
1840 1850 1860 1870 1880 1890
pF1KA1 LANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFW
..:...::. ::::.. . :. .: :::. : .:. :: :.::.:.. :: .
CCDS33 VTNFIYDMVFYLVPVAFSIGIIAIFKLPAFYSENNLGAVSLLLLLFGYATFSWMYLLAGL
2040 2050 2060 2070 2080 2090
1900 1910 1920 1930 1940 1950
pF1KA1 FEVPSSAYVFLIVINLFIGITA----TVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYN
:. . :.. . .:::.::.. .:. :: . .: :.... :: :::::..
CCDS33 FHETGMAFITYVCVNLFFGINSIVSLSVVYFLSKEKPNDPTLELISETLKRIFLIFPQFC
2100 2110 2120 2130 2140 2150
1960 1970 1980 1990 2000 2010
pF1KA1 LGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYN
.:.::.:.. .. . .. : . . :: . . .::.. .:.. : : .. . .
CCDS33 FGYGLIELSQQQSVLDFLKAYG-VEYPNETFEMNKLGAMFVALVSQGTMFFSLRLLINES
2160 2170 2180 2190 2200 2210
2020 2030 2040 2050 2060
pF1KA1 FLRRPQ---RMPVST---KPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGR
.... . : :. . ...: :: .:: :: : :. :.:.. :::.:. . .
CCDS33 LIKKLRLFFRKFNSSHVRETIDEDEDVRAERLRVESGAAEFDLVQLYCLTKTYQLIH-KK
2220 2230 2240 2250 2260
2070 2080 2090 2100 2110 2120
pF1KA1 ILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQ
:.::. . .:. :::::::::::::::. ::::::: ..:. .. ... .. .
CCDS33 IIAVNNISIGIPAGECFGLLGVNGAGKTTIFKMLTGDIIPSSGNILIRNKTGSLGHVDSH
2270 2280 2290 2300 2310 2320
2130 2140 2150 2160 2170 2180
pF1KA1 QSL-GYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGT
.:: ::::: ::: : .:..::: .:.:..:: :: ..:. :..:.: . :. ..
CCDS33 SSLVGYCPQEDALDDLVTVEEHLYFYARVHGIPEKDIKETVHKLLRRLHLMPFKDRATSM
2330 2340 2350 2360 2370 2380
2190 2200 2210 2220 2230 2240
pF1KA1 YSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSM
: :.:::::::.:::: :....::::..:::::..: ::..: . ... ::.::::::
CCDS33 CSYGTKRKLSTALALIGKPSILLLDEPSSGMDPKSKRHLWKIISEEVQNKCSVILTSHSM
2390 2400 2410 2420 2430 2440
2250 2260 2270 2280 2290 2300
pF1KA1 EECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQ-SVKDVVRFFNRNFP
::::::::::::::::...:.::.::.:.::: :. . :. :... ... ...:.. .::
CCDS33 EECEALCTRLAIMVNGKFQCIGSLQHIKSRFGRGFTVKVHLKNNKVTMETLTKFMQLHFP
2450 2460 2470 2480 2490 2500
2310 2320 2330 2340 2350 2360
pF1KA1 EAMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQ
...::..: . ..:.. ..:..:. .: . .:.: .. ::::::..::.:::: :
CCDS33 KTYLKDQHLSMLEYHVPVTAGGVANIFDLLETNKTALNITNFLVSQTTLEEVFINFAKDQ
2510 2520 2530 2540 2550 2560
2370 2380 2390 2400 2410 2420
pF1KA1 SDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEER
CCDS33 KSYETADTSSQGSTISVDSQDDQMES
2570 2580 2590
>>CCDS10466.1 ABCA3 gene_id:21|Hs108|chr16 (1704 aa)
initn: 2972 init1: 905 opt: 1139 Z-score: 926.8 bits: 185.0 E(32554): 2.7e-45
Smith-Waterman score: 3082; 34.0% identity (59.9% similar) in 1943 aa overlap (512-2370:39-1702)
490 500 510 520 530
pF1KA1 VGNVTHYAQVWLNISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEAL---NLSLDELPP
: ::. . . :.: . :..:::
CCDS10 LLLWKNYTLQKRKVLVTVLELFLPLLFSGILIWLRLKIQSENV-PNATIYPGQSIQELPL
10 20 30 40 50 60
540 550 560 570 580 590
pF1KA1 ALRQDNFSLPSGMALLQQLDTIDNAACGWIQFMSK-VSVDI-FKGFPDEESIVNYTLNQA
. .: :. : . . ..:: . . . . ... .:::.:... .:
CCDS10 FF---TFPPPGDTWELAYIPSHSDAAKTVTETVRRALVINMRVRGFPSEKDFEDYI----
70 80 90 100 110 120
600 610 620 630
pF1KA1 YQDNVT--VFASVIFQTRKDGS---LPPHVHYKIR-----------QNSSFTEKTNE---
:: . :.:.:.:. . : :: :.:..: :..:: : .:
CCDS10 RYDNCSSSVLAAVVFEHPFNHSKEPLPLAVKYHLRFSYTRRNYMWTQTGSFFLKETEGWH
130 140 150 160 170 180
640 650 660 670 680
pF1KA1 ---IRRAYWRPGPNT-----GGRF-YFLYGFVWIQDMMERAII----DTFVGHDVVEPGS
. . ::: ::. :. ::. .: ..:::. :. . . .
CCDS10 TTSLFPLFPNPGPREPTSPDGGEPGYIREGFLAVQHAVDRAIMEYHADAATRQLFQRLTV
190 200 210 220 230 240
690 700 710 720 730 740
pF1KA1 YVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLN
.. :::: . : :: .:....:: ...:..:.. . .: :::.:::: :. :::.
CCDS10 TIKRFPYPPFIADPFLVAIQYQLPLLLLLSFTYTALTIARAVVQEKERRLKEYMRMMGLS
250 260 270 280 290 300
750 760 770 780 790
pF1KA1 NAVHWVAWFITGFVQLSISVTALTAILKYG-----QVLMHSHVVIIWLFLAVYAVATIMF
. .:: :::. :. : :... .: .. :: .: .. :: .:..:: :
CCDS10 SWLHWSAWFLLFFLFLLIAASFMTLLFCVKVKPNVAVLSRSDPSLVLAFLLCFAISTISF
310 320 330 340 350 360
800 810 820 830 840 850
pF1KA1 CFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFG
:.::...:::..:.: ::..::..:.::..:: : .. .: .: . :.:..:..
CCDS10 SFMVSTFFSKANMAAAFGGFLYFFTYIPYFFVAPR----YNWMTLSQKLCSCLLSNVAMA
370 380 390 400 410
860 870 880 890 900 910
pF1KA1 LGSKYFALYEVAGVGIQWHTFSQSPVE-GDDFNLLLAVTMLMVDAVVYGILTWYIEAVHP
.:.. .. .:. :.::::. . :::. ::: . .. ::..:.:.::..:::.::: :
CCDS10 MGAQLIGKFEAKGMGIQWRDL-LSPVNVDDDFCFGQVLGMLLLDSVLYGLVTWYMEAVFP
420 430 440 450 460 470
920 930 940 950 960 970
pF1KA1 GMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRG
:..:.:.:::: .. ::: :. :. : . . : :.... ::
CCDS10 GQFGVPQPWYFFIMPSYWCGKPRAVAGKEE-----------EDSDPEKALRNEYFEA---
480 490 500 510 520
980 990 1000 1010 1020 1030
pF1KA1 MEEEPTHLPLVVCVDKLTKVYK--DDKKLALNKLSLNLYENQVVSFLGHNGAGKTTTMSI
:: : . . .:.::.. . . :. :.:::::.:.. .:::::::::::.:.
CCDS10 ---EPEDLVAGIKIKHLSKVFRVGNKDRAAVRDLNLNLYEGQITVLLGHNGAGKTTTLSM
530 540 550 560 570
1040 1050 1060 1070 1080 1090
pF1KA1 LTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQ
:::::::::: : : :..: .: .:::.::.::::..::: ::: :::.::..::....
CCDS10 LTGLFPPTSGRAYISGYEISQDMVQIRKSLGLCPQHDILFDNLTVAEHLYFYAQLKGLSR
580 590 600 610 620 630
1100 1110 1120 1130 1140 1150
pF1KA1 EEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPY
.. .:. .:.. . : .: .: . :::::.::::..::...::...::::::.:.:
CCDS10 QKCPEEVKQMLHIIGLEDKWNSRSRFLSGGMRRKLSIGIALIAGSKVLILDEPTSGMDAI
640 650 660 670 680 690
1160 1170 1180 1190 1200 1210
pF1KA1 ARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGY
.:::::::. . : :::.:.:: :::::::::::::...:.:.:::: :::: :: ::
CCDS10 SRRAIWDLLQRQKSDRTIVLTTHFMDEADLLGDRIAIMAKGELQCCGSSLFLKQKYGAGY
700 710 720 730 740 750
1220 1230 1240 1250 1260 1270
pF1KA1 RLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSY
..::::.: :. ..::....:: . : :....:::.
CCDS10 HMTLVKEP----------------------HCNPEDISQLVHHHVPNATLESSAGAELSF
760 770 780 790
1280 1290 1300 1310 1320 1330
pF1KA1 ILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVK
::: :.... :: :: .::.. : ..::: ::.:::::.:.. : .: :..
CCDS10 ILPRESTHR--FEGLFAKLEKKQKELGIASFGASITTMEEVFLRVGK----LVDSSMDIQ
800 810 820 830 840 850
1340 1350 1360 1370 1380 1390
pF1KA1 ESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDY
. ::. . . : .:.. : :.: :. ..: :
CCDS10 AIQ---LPALQ--YQHERRASDWAVDSNLC------------GAMDPSDGIG--------
860 870 880
1400 1410 1420 1430 1440 1450
pF1KA1 RPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGW-LKVRQFHGLLVKRFHCARRNSK
.: : : :. ::. : :. .:: ....:. . :. :
CCDS10 -------------ALIEEERTAV--------KLNTGLALHCQQFWAMFLKKAAYSWREWK
890 900 910 920
1460 1470 1480 1490 1500 1510
pF1KA1 ALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREY
. .:.:.: : .:. . :. : : : :. ..: . :
CCDS10 MVAAQVLVPLTCVTLALLAINYSSELFDDPMLRLTLGEYGRTVVP---------------
930 940 950 960
1520 1530 1540 1550 1560 1570
pF1KA1 RLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMC
: .: : :.:
CCDS10 ----------------FSVP-------------------------GTSQL----------
970
1580 1590 1600 1610 1620 1630
pF1KA1 LESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVR
: ::. . .:. :::
CCDS10 ------GQQLSEHL--------KDA-------LQAE------------------------
980 990
1640 1650 1660 1670 1680 1690
pF1KA1 EPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVSEYLLFTSDRFRLHRYG
:. : : : ::. :.:.: : .. :
CCDS10 ---------------------GQEP--REVLGDL---------EEFLIF---RASVEGGG
1000 1010
1700 1710 1720 1730 1740 1750
pF1KA1 AITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSMPTYLNSLNNAILRANL
: : . ::: : .. : ......::..::: : : ..: ..
CCDS10 ---F-NERCLVAASF--------RDVGERTVVNALFNNQAYHSPATALAVVDNLLF----
1020 1030 1040 1050 1060
1760 1770 1780 1790 1800 1810
pF1KA1 PKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVV-IAIFIIVAMSFVPASFVVFLV
: .: : .:.:.: :. ... . . : . .: ::. .. ::.:. ..: .. :
CCDS10 -KLLCGPHA-SIVVSNFPQPRSALQAAKDQFNEGRKGFDIALNLLFAMAFLASTFSILAV
1070 1080 1090 1100 1110 1120
1820 1830 1840 1850 1860 1870
pF1KA1 AEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPA
.:....:::.::::: . .::. .::....:.:. .... .::. :.: ..
CCDS10 SERAVQAKHVQFVSGVHVASFWLSALLWDLISFLIPSLLLLVVFKAFDVRAFTRDGHMAD
1130 1140 1150 1160 1170 1180
1880 1890 1900 1910 1920 1930
pF1KA1 VLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEHDKDL
.: :.:::::.: :.:: .:.: ..::. : ..:.. :: ::::. . . .
CCDS10 TLLLLLLYGWAIIPLMYLMNFFFLGAATAYTRLTIFNILSGI----ATFLMVTIMRIPAV
1190 1200 1210 1220 1230
1940 1950 1960 1970 1980
pF1KA1 KV--VNSYLKSCFLIFPNYNLGHGLMEMAYNEY----------INEYYAKIGQFDKMKSP
:. ... : ::..::. :: .. . :..: . .: : ... ...
CCDS10 KLEELSKTLDHVFLVLPNHCLGMAVSSF-YENYETRRYCTSSEVAAHYCKKYNIQYQENF
1240 1250 1260 1270 1280 1290
1990 2000 2010 2020
pF1KA1 FEWDI--VTRGLVAMAVEGVVGFLLTIMCQYNFLRRPQ-----------------RMPVS
. :. : : ...::. : . ..: .. . :.:.: . ::::
CCDS10 YAWSAPGVGRFVASMAASGCAYLILLFLIETNLLQRLRGILCALRRRRTLTELYTRMPV-
1300 1310 1320 1330 1340 1350
2030 2040 2050 2060 2070 2080
pF1KA1 TKPVEDDVDVASERQRVLRGDADNDM---VKIENLTKVYKSRKIGRILAVDRLCLGVRPG
. .: :::.:: :.: . :. . . :..:.:::..: .:::::: :.:. :
CCDS10 ---LPEDQDVADERTRILAPSPDSLLHTPLIIKELSKVYEQRVP--LLAVDRLSLAVQKG
1360 1370 1380 1390 1400
2090 2100 2110 2120 2130 2140
pF1KA1 ECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGYCPQCDALFD
::::::: ::::::.:::::::.:: :.:.:::.:: . ... .:.: .::::: :::.:
CCDS10 ECFGLLGFNGAGKTTTFKMLTGEESLTSGDAFVGGHRISSDVGKVRQRIGYCPQFDALLD
1410 1420 1430 1440 1450 1460
2150 2160 2170 2180 2190 2200
pF1KA1 ELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPAGTYSGGNKRKLSTAIAL
..:.:: : .:.::::: . . :. .:. : : .:.: . ::::::::::::.:::
CCDS10 HMTGREMLVMYARLRGIPERHIGACVENTLRGLLLEPHANKLVRTYSGGNKRKLSTGIAL
1470 1480 1490 1500 1510 1520
2210 2220 2230 2240 2250 2260
pF1KA1 IGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSVVLTSHSMEECEALCTRLAIMVN
:: :: ::::::.::::: :::.::. . ..:.....:::::::::::::::::::.
CCDS10 IGEPAVIFLDEPSTGMDPVARRLLWDTVARARESGKAIIITSHSMEECEALCTRLAIMVQ
1530 1540 1550 1560 1570 1580
2270 2280 2290 2300 2310
pF1KA1 GRLRCLGSIQHLKNRFGDGYMITVRTKS---SQSVKDVVRFFNRNFPEAMLKERHHTKVQ
:...:::: ::::..::.:: . ....: ...... : . .:: ..:...:. :.
CCDS10 GQFKCLGSPQHLKSKFGSGYSLRAKVQSEGQQEALEEFKAFVDLTFPGSVLEDEHQGMVH
1590 1600 1610 1620 1630 1640
2320 2330 2340 2350 2360 2370
pF1KA1 YQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPS
:.: .. .: :.::. .:... :..:::::: .:..::..::. : . :.
CCDS10 YHLPGRDLSWAKVFGILEKAKEKYGVDDYSVSQISLEQVFLSFAHLQPPTAEEGR
1650 1660 1670 1680 1690 1700
2380 2390 2400 2410 2420 2430
pF1KA1 ALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC
>>CCDS11685.1 ABCA5 gene_id:23461|Hs108|chr17 (1642 aa)
initn: 1372 init1: 524 opt: 722 Z-score: 587.1 bits: 122.1 E(32554): 2.2e-26
Smith-Waterman score: 1570; 26.2% identity (53.3% similar) in 1902 aa overlap (524-2366:52-1618)
500 510 520 530 540 550
pF1KA1 NISAKIRSFLEQGRLQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQ--DNFSLPSGM
.:: : . .:.: . :.:.: .
CCDS11 YLIKCRTKKSSVQEILFPLFFLFWLILISMMHP---NKKYEEVPNIELNPMDKFTLSN--
30 40 50 60 70
560 570 580 590 600
pF1KA1 ALLQQLDTIDNAACGWIQFMSKVSVD------IFKGFPDEESIVNYTLNQAYQDNVTVFA
:. . : . . .:.:::.: : . . .:. ... .:.. . :.
CCDS11 -LILGYTPVTNITSS---IMQKVSTDHLPDVIITEEYTNEKEMLTSSLSKP-----SNFV
80 90 100 110 120
610 620 630 640 650 660
pF1KA1 SVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYW--RPGPNTGGRF--YFLYGFVW
.:.: ::. . :..: : . : : : . . . :. ::.
CCDS11 GVVF---KDS-----MSYELR----FFPDMIPVSSIYMDSRAGCSKSCEAAQYWSSGFTV
130 140 150 160 170
670 680 690 700 710
pF1KA1 IQDMMERAIIDTFVGHDV---VEPGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWV-Y
.: .. :::. .. .. .: . : : : : . .. . .::.. .
CCDS11 LQASIDAAIIQLKTNVSLWKELESTKAVIMGETAVVEIDTF---PRGVILIYLVIAFSPF
180 190 200 210 220 230
720 730 740 750 760 770
pF1KA1 SVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTALTAILKYGQVL
. ..: :::::::...:: .: :::.... :..: . ...: . .. : :.. ...:
CCDS11 GYFLAI-HIVAEKEKKIKEFLKIMGLHDTAFWLSWVLL-YTSLIFLMSLLMAVIATASLL
240 250 260 270 280 290
780 790 800 810 820 830
pF1KA1 M-HSHVVIIWLFLAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREE
. .: ..:.:.. .:......: .... :..:.: . ::. :. : . ....
CCDS11 FPQSSSIVIFLLFFLYGLSSVFFALMLTPLFKKSKHV----GIVEFFVTVAFGFIGLMII
300 310 320 330 340
840 850 860 870 880 890
pF1KA1 VAHDKITAFEKCIASLMST---TAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLL
. : .: : .. :.: .: .: : . : .. ... .: . :.
CCDS11 L----IESFPKSLVWLFSPFCHCTFVIGIAQVMHLEDFNEGASFSNLTAGP-----YPLI
350 360 370 380 390
900 910 920 930 940 950
pF1KA1 LAVTMLMVDAVVYGILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWAR
... :: .... : .:. :.. : :: .:: : . :. ::: : :. .:
CCDS11 ITIIMLTLNSIFYVLLAVYLDQVIPGEFGLRRSSLYFLKPSYWSKSKRN--YEELSEGNV
400 410 420 430 440 450
960 970 980 990 1000 1010
pF1KA1 TPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKVY--KDDKKLALNKLS
. .: : . . : : : .. . :.: : .. :: .::
CCDS11 NGNISFSEIIEPVSSEFVGKEAIR--------------ISGIQKTYRKKGENVEALRNLS
460 470 480 490 500
1020 1030 1040 1050 1060
pF1KA1 LNLYENQVVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRTEMDEI---RKNLGM
...::.:....:::.:.::.: :.:: :: ::..: :.:::: . .:.::. :: .:.
CCDS11 FDIYEGQITALLGHSGTGKSTLMNILCGLCPPSDGFASIYGHRV-SEIDEMFEARKMIGI
510 520 530 540 550 560
1070 1080 1090 1100 1110 1120
pF1KA1 CPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMK
::: .. :: :::::.: . . .:.. ..: .:..:.. ::.... . . .. ::::.:
CCDS11 CPQLDIHFDVLTVEENLSILASIKGIPANNIIQEVQKVLLDLDMQTIKDNQAKKLSGGQK
570 580 590 600 610 620
1130 1140 1150 1160 1170 1180
pF1KA1 RKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLG
::::..:: .:. . ..:::::::.:: .:. .:.:. : .:. ..::: :::::.:.
CCDS11 RKLSLGIAVLGNPKILLLDEPTAGMDPCSRHIVWNLLKYRKANRVTVFSTHFMDEADILA
630 640 650 660 670 680
1190 1200 1210 1220 1230 1240
pF1KA1 DRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSC
:: :.::.: ::: :: .:::. .: ::::.. . :
CCDS11 DRKAVISQGMLKCVGSSMFLKSKWGIGYRLSMYID----------------------KYC
690 700 710
1250 1260 1270 1280 1290 1300
pF1KA1 SELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFG
. ..:.....:. . :..... .: : :: . : : :: :. : . : . :.:
CCDS11 ATESLSSLVKQHIPGATLLQQNDQQLVYSLPFKDMDK--FSGLFSALD-SHSNLGVISYG
720 730 740 750 760 770
1310 1320 1330 1340 1350 1360
pF1KA1 LMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQS
. ::::.:::: :: ::.. .. .:. .. : : . .. .:. ::
CCDS11 VSMTTLEDVFLK-------LE-VEAEIDQADYSVF--TQQPLEEEMDSKSF---DEMEQS
780 790 800 810 820
1370 1380 1390 1400 1410 1420
pF1KA1 QASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRK
. :.:..: .: .. ...
CCDS11 L---------------------------------------LILSETKAALVSTMSLWKQQ
830 840
1430 1440 1450 1460 1470 1480
pF1KA1 LDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGD-LPPL
. . .:: : .:.::.. : .:: .: : . . : . . . :.
CCDS11 M----YTIAKFH------FFTLKRESKSVRSVLLLLLIFFTVQIFMFLVHHSFKNAVVPI
850 860 870 880 890
1490 1500 1510 1520 1530 1540
pF1KA1 VLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSP
: :. : . .: :. :. . . :. : :.. ..:.: : ... .: . :
CCDS11 KLVPDLY--FLKP-GD-KPH--KYKTSLLLQNSADSDISDLISFFT-SQNIMVTMINDSD
900 910 920 930 940
1550 1560 1570 1580 1590 1600
pF1KA1 ANGSLGP---TLNLSSGESRLLAARFFDSMCLESFTQGLP-LSNFVPPPPSPAPSDSPAS
:..: .::. .:. . : :.: ... .:: : :..
CCDS11 YV-SVAPHSAALNVMHSEKDYVFAAVFNS----TMVYSLPILVNIIS-------------
950 960 970 980
1610 1620 1630 1640 1650 1660
pF1KA1 PDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMR
. : :: : ..: :.: . ..
CCDS11 -NYYLYHLNV----TETIQIW-STPFFQEI------------------------------
990 1000 1010
1670 1680 1690 1700 1710 1720
pF1KA1 VVTGDILTDITGHNVSEYLLFTSDRFRLHRY-GAITFGNVLKSIPASFGTRAPPMVRKIA
:::. :... : : .: .. ..: :.
CCDS11 -------TDIV--------------FKIELYFQAALLGIIVTAMPPYFA-----------
1020 1030 1040
1730 1740 1750 1760 1770 1780
pF1KA1 VRRAAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAY--GITVTNHPMNKTSAS
..: :.. .: . ...: :.:: : .:.. :.
CCDS11 --------MENAENHKIKAYTQLKLSGLL----------PSAYWIGQAVVDIPLFFIILI
1050 1060 1070 1080
1790 1800 1810 1820 1830
pF1KA1 LSLDYLLQ---GTDVVIAIFIIVA---MSFVPASFVVFLVAEKSTKAKHLQFVSGCNPII
: : :: : . :. :. ...:: : ..: . : : : :
CCDS11 LMLGSLLAFHYGLYFYTVKFLAVVFCLIGYVP-SVILFTYIASFTFKKIL------NTKE
1090 1100 1110 1120 1130
1840 1850 1860 1870 1880 1890
pF1KA1 YWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPAS
.: ... : : : :. :. . ...:..:. :.. :
CCDS11 FW--SFI-----YSVAALACI------------------AITEITFFMGYTIATILHYA-
1140 1150 1160
1900 1910 1920 1930 1940 1950
pF1KA1 FWFEVPSSAYVFLIVINLFIGITATVATFLLQLFEH-DK-DLKVVNSYLKSCFLIFPNYN
: . .: : .: . :: :. . .. .. :. .. :.. ::. . ::
CCDS11 FCIIIP--IYPLLGCLISFIKISWKNVRKNVDTYNPWDRLSVAVISPYLQCVLWIF----
1170 1180 1190 1200 1210 1220
1960 1970 1980 1990 2000 2010
pF1KA1 LGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMCQYN
:... : : : . :.:: .. :..
CCDS11 ----LLQY--------YEKKYGGRSIRKDPFFRNLSTKS---------------------
1230 1240 1250
2020 2030 2040 2050 2060
pF1KA1 FLRRPQRMPVSTKPVEDDVDVASERQRV--LRGDA---DNDMVKIENLTKVYK-------
. ...: ..: :: .:: .: : : .. . . :: : :
CCDS11 ---KNRKLPEPPDNEDEDEDVKAERLKVKELMGCQCCEEKPSIMVSNLHKEYDDKKDFLL
1260 1270 1280 1290 1300
2070 2080 2090 2100 2110
pF1KA1 SRKIGRILAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSV-L
:::. .. :. . . :. :: .:::: :::::.. ...:.:: :.:..:.. .:
CCDS11 SRKVKKV-ATKYISFCVKKGEILGLLGPNGAGKSTIINILVGDIEPTSGQVFLGDYSSET
1310 1320 1330 1340 1350 1360
2120 2130 2140 2150 2160 2170
pF1KA1 KELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYA
.: . . .::::: . :. . : .::...: ..:.: .: .:.. . :.: ..
CCDS11 SEDDDSLKCMGYCPQINPLWPDTTLQEHFEIYGAVKGMSASDMKEVISRITHALDLKEHL
1370 1380 1390 1400 1410 1420
2180 2190 2200 2210 2220 2230
pF1KA1 DKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKT-GRSV
.: . .: :::: :....: : . .::::.:::::::.. .: : .:. :..
CCDS11 QKTVKKLPAGIKRKLCFALSMLGNPQITLLDEPSTGMDPKAKQHMWRAIRTAFKNRKRAA
1430 1440 1450 1460 1470 1480
2240 2250 2260 2270 2280 2290
pF1KA1 VLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKS---SQSVKDV
.::.: ::: ::.: :.::::.:.:::.:..::::..:: ::.. .. :. . : .
CCDS11 ILTTHYMEEAEAVCDRVAIMVSGQLRCIGTVQHLKSKFGKGYFLEIKLKDWIENLEVDRL
1490 1500 1510 1520 1530 1540
2300 2310 2320 2330 2340 2350
pF1KA1 VRFFNRNFPEAMLKERHHTKVQYQLKSEHI-SLAQVFSKMEQVSGVLGIEDYSVSQTTLD
: .. ::.: .: . . :.. .: . ::.: : :.:... ...::.:: ::.::.
CCDS11 QREIQYIFPNASRQESFSSILAYKIPKEDVQSLSQSFFKLEEAKHAFAIEEYSFSQATLE
1550 1560 1570 1580 1590 1600
2360 2370 2380 2390 2400 2410
pF1KA1 NVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTED
.:::...:.: .
CCDS11 QVFVELTKEQEEEDNSCGTLNSTLWWERTQEDRVVF
1610 1620 1630 1640
>>CCDS74138.1 ABCA8 gene_id:10351|Hs108|chr17 (1616 aa)
initn: 1343 init1: 524 opt: 718 Z-score: 584.0 bits: 121.5 E(32554): 3.3e-26
Smith-Waterman score: 1584; 26.3% identity (52.7% similar) in 1964 aa overlap (490-2375:11-1604)
460 470 480 490 500 510
pF1KA1 LYAPAGSEVDRVILKANETFAFVGNVTHYAQVWLNISAKIRSFLEQGRLQQH--LRWLQQ
:.: . ..::.. :.... ..::..
CCDS74 MRKRKISVCQQTWALLC---KNFLKKWRMKRESLMEWLNS
10 20 30
520 530 540 550 560
pF1KA1 YVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAACGWI---------
. : : : : . . ..:: : : ..::.... . .
CCDS74 LL---------LLLCLYIYPHSHQVNDFSSLLTMDL-GRVDTFNESRFSVVYTPVTNTTQ
40 50 60 70 80
570 580 590 600 610
pF1KA1 QFMSKVSVDIFK------GFPDEESIVNYTLNQAYQDNVTVFASVIFQTRK---DGSLPP
:.:.::. : :.:::::: ..: : . ..:... : ..:
CCDS74 QIMNKVASTPFLAGKEVLGLPDEESIKEFTANYPEEIVRVTFTNTYSYHLKFLLGHGMPA
90 100 110 120 130 140
620 630 640 650 660 670
pF1KA1 HVHYKIRQNSSFTEKTNEIRR----AYWRPGPNTGGRFYFLYGFVWIQDMMERAIIDTFV
. ..: .... .::: ..:. : :: .: .. :::. .
CCDS74 KKEHK--DHTAHCYETNEDVYCEVSVFWKEG------------FVALQAAINAAIIEITT
150 160 170 180 190
680 690 700 710 720 730
pF1KA1 GHDVVEP-----GSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEK
.:.:.: :. ..: . . :: .. . .::. . .. ... :.
CCDS74 NHSVMEELMSVTGKNMKMHSFIGQSG-----VITDLYLFSCIISFSSFIYYASVNVTRER
200 210 220 230 240
740 750 760 770 780
pF1KA1 EHRLKEVMKTMGLNNAVHWVAW--FITGFVQLSISVTALTAILKYGQVLMHSHVVIIWLF
. :.: .: ::: ... :..: . .::. . :: ... : .. : .... .
CCDS74 K-RMKALMTMMGLRDSAFWLSWGLLYAGFIFIMALFLAL--VIRSTQFIILSGFMVVFSL
250 260 270 280 290 300
790 800 810 820 830 840
pF1KA1 LAVYAVATIMFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKC
. .:... . . ::.:.: .:. :. :.. :: : . ... : . : .
CCDS74 FLLYGLSLVALAFLMSILVKKSFLT----GLVVFLLTVFWGCLGFTSLYRH--LPASLEW
310 320 330 340 350
850 860 870 880 890 900
pF1KA1 IASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVT-MLMVDAVVYG
: ::.: :: :: . . .. ..: : .: ::..:.. :: :. .:
CCDS74 ILSLLSPFAFMLGMAQLLHLDY---DLNSNAF---PHPSDGSNLIVATNFMLAFDTCLYL
360 370 380 390 400 410
910 920 930 940 950 960
pF1KA1 ILTWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACA
:. :.: . :. :: :: : :..:.: . .:. : ::. :
CCDS74 ALAIYFEKILPNEYGHRRPPLFFLKSSFWSQTQKTD--------------HVALEDEMDA
420 430 440 450
970 980 990 1000 1010 1020
pF1KA1 MESRRFEETRGMEEEPTHLP--LVVCVDKLTKVYKD--DKKLALNKLSLNLYENQVVSFL
: :... .:. : .. .. . ..:: :: :: ::. : ...::.:....:
CCDS74 DPS--FHDS--FEQAPPEFQGKEAIRIRNVTKEYKGKPDKIEALKDLVFDIYEGQITAIL
460 470 480 490 500 510
1030 1040 1050 1060 1070 1080
pF1KA1 GHNGAGKTTTMSILTGLFPPTSGSATIYGHDIR--TEMDEIRKNLGMCPQHNVLFDRLTV
::.::::.: ..::.:: ::.::.:::.. . ...... : :.::: :: :: :::
CCDS74 GHSGAGKSTLLNILSGLSVPTKGSVTIYNNKLSEMADLENLSKLTGVCPQSNVQFDFLTV
520 530 540 550 560 570
1090 1100 1110 1120 1130 1140
pF1KA1 EEHLWFYSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGS
.:.: .....:.. .:. .:..... .::..: . :.:.::::.::::. .::..:
CCDS74 RENLRLFAKIKGILPQEVDKEIQRVLLELEMKNIQDVLAQNLSGGQKRKLTFGIAILGDP
580 590 600 610 620 630
1150 1160 1170 1180 1190 1200
pF1KA1 RAIILDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKC
. ..:::::::.::..:. .:.:. . : :.::.::. :::::.:.:: ...:.:::::
CCDS74 QIFLLDEPTAGLDPFSRHQVWNLLKERKTDRVILFSTQFMDEADILADRKVFLSQGKLKC
640 650 660 670 680 690
1210 1220 1230 1240 1250 1260
pF1KA1 CGSPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHV
:: :::: .: ::.:.: : : ........:.
CCDS74 AGSSLFLKKKWGIGYHLSLQLNEI----------------------CVEENITSLVKQHI
700 710 720 730
1270 1280 1290 1300 1310 1320
pF1KA1 ASCLLVSDTSTELSYILPSEAAKKGAFERLFRHLERSLDALHLSSFGLMDTTLEEVFLKV
. : . . .: : :: : ..: : .:.. :. : : . ..:. :::.:::::.
CCDS74 PDAKLSAKSEGKLIYTLPLERTNK--FPELYKDLD-SYPDLGIENYGVSMTTLNEVFLKL
740 750 760 770 780 790
1330 1340 1350 1360 1370 1380
pF1KA1 SEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSA-SSVGS
: .: : :.:. .: : ...: .: . : :. : .::.. ...:.
CCDS74 --EGKSTIN-ESDIA-----IL----GEVQAE-KADDTERLVEMEQVLSSLNKMRKTIGG
800 810 820 830
1390 1400 1410 1420 1430 1440
pF1KA1 ARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFH
:.: . . :..:: .: ::...
CCDS74 ----------------------------VALWRQQICAIARV-----RL----LKLKH--
840 850
1450 1460 1470 1480 1490 1500
pF1KA1 GLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQP
. :::.. .:. : ::.. .::.
CCDS74 ------------ERKALLALLLILMAGFC----------------PLLV------EYTMV
860 870 880
1510 1520 1530 1540 1550 1560
pF1KA1 RGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSS
. : : : .::: . : : ..: . : .:
CCDS74 K----IYQN----SYTWELSPH--------LYFLAPG-------QQPHD----PLTQL--
890 900 910
1570 1580 1590 1600 1610
pF1KA1 GESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTA-
:. . : ...:. .... :..: :
CCDS74 ----LIINK-----------TGASIDDFI----------------QSVEHQNIALEVDAF
920 930 940
1620 1630 1640 1650 1660 1670
pF1KA1 GPEMWTSAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRVVTGDILTDITGHNVS
: . :. :: . . : :. .. .:: .. :. .: :: ::
CCDS74 GTRNGTDDPSYNGAI---TVC-CNEKNYSFSLACNAK------RLNCFPVLMDI----VS
950 960 970 980 990
1680 1690 1700 1710 1720 1730
pF1KA1 EYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRRAAQVFYNNKGYHSM
. :: : : .. .: ..: .:
CCDS74 NGLL---------------------------GMVKP----SVHIRTERSTFLEN------
1000 1010
1740 1750 1760 1770 1780 1790
pF1KA1 PTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDVVIAIFII
.. :: .. : :.. : .
CCDS74 ------------------GQDNPIGF-----------------LAYIM---------FWL
1020
1800 1810 1820 1830 1840 1850
pF1KA1 VAMSFVPASFVVFLVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILF
: : : ... . . ...:. .:: .: ::... . :. :.. ...:
CCDS74 VLTSSCPPYIAMSSIDDYKNRARSQLRISGLSPSAYWFGQALVDVSLYFL------VFVF
1030 1040 1050 1060 1070 1080
1860 1870 1880 1890 1900
pF1KA1 VFDLPAYTSPTNFPAVLSLFLL---------YGWSITPIMYPASFWFEVP---SSAYVF-
.. : .: : :: .: .. :..:. . : :: :. :. . :
CCDS74 IY-LMSYIS--NFEDMLLTIIHIIQIPCAVGYSFSLIFMTYVISFIFRKGRKNSGIWSFC
1090 1100 1110 1120 1130 1140
1910 1920 1930 1940 1950 1960
pF1KA1 LIVINLFIGITATVATFLLQLFEHDKDLKVVNSYLKSCFLIFPNYNLGHGLM--EMAYNE
. :...: .:: : ...:: .:. . . ::: : .: .. .. ..
CCDS74 FYVVTVF-----SVAGFAFSIFE--SDIPFIFT-----FLIPPATMIGCLFLSSHLLFSS
1150 1160 1170 1180
1970 1980 1990 2000 2010 2020
pF1KA1 YINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGVVGFLLTIMC-QYNFLRRPQRM-P-
..: . : . :: :. ::.:. : ...: .. .: :
CCDS74 LFSEERMDVQPFLVFLIPFLHFII--------------FLFTLRCLEWKFGKKSMRKDPF
1190 1200 1210 1220 1230
2030 2040 2050 2060
pF1KA1 ----VSTKPVE---DDVDVASERQRVLRG----DADNDMVKIEN-LTKVYKSRKIGRI--
: .: : .: :: :: :. . . :. : : . : : : ... : .
CCDS74 FSSDVCQNPEEPEGEDEDVQMERVRTANALNSTNFDEKPVIIASCLRKEYAGKRKGCFSK
1240 1250 1260 1270 1280 1290
2070 2080 2090 2100 2110 2120
pF1KA1 ----LAVDRLCLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELL
.:. . . :: :: .:::: :::::....:..::: . :.:.....: . :
CCDS74 RKNKIATRNVSFCVRKGEVLGLLGHNGAGKSTSIKVITGDTKPTAGQVLLKGSGGGDAL-
1300 1310 1320 1330 1340 1350
2130 2140 2150 2160 2170 2180
pF1KA1 QVQQSLGYCPQCDALFDELTAREHLQLYTRLRGISWKDEARVVKWALEKLELTKYADKPA
. :::::: .::. .::.:.::..:. ..:. : .. .. :.: .:.
CCDS74 ---EFLGYCPQENALWPNLTVRQHLEVYAAVKGLRKGDAEVAITRLVDALKLQDQLKSPV
1360 1370 1380 1390 1400 1410
2190 2200 2210 2220 2230 2240
pF1KA1 GTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIK-TGRSVVLTS
: : : :::: .....: :. ..::::.:::::.... .:. : .. : :...::.
CCDS74 KTLSEGIKRKLCFVLSILGNPSVVLLDEPSTGMDPEGQQQMWQAIRATFRNTERGALLTT
1420 1430 1440 1450 1460 1470
2250 2260 2270 2280 2290 2300
pF1KA1 HSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDVVRFFNRN
: : : ::.: :.::::.:::::.:::::::..:: :.. ...:. .:. . . :
CCDS74 HYMAEAEAVCDRVAIMVSGRLRCIGSIQHLKSKFGKDYLLEMKVKNLAQVEPLHAEILRL
1480 1490 1500 1510 1520 1530
2310 2320 2330 2340 2350 2360
pF1KA1 FPEAMLKERHHTKVQYQLKSEHIS-LAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFA
::.: .::. . . :.: : .. :::.: :.:.:. . .:.::.::.::..::....
CCDS74 FPQAARQERYSSLMVYKLPVEDVQPLAQAFFKLEKVKQSFDLEEYSLSQSTLEQVFLELS
1540 1550 1560 1570 1580 1590
2370 2380 2390 2400 2410 2420
pF1KA1 KKQSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE
:.: . ... .:
CCDS74 KEQELGDFEEDFDPSVKWKLLPQEEP
1600 1610
2435 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 20:21:09 2016 done: Wed Nov 2 20:21:10 2016
Total Scan time: 7.900 Total Display time: 1.860
Function used was FASTA [36.3.4 Apr, 2011]