FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6405, 606 aa 1>>>pF1KE6405 606 - 606 aa - 606 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2204+/-0.000973; mu= 19.6906+/- 0.058 mean_var=77.1319+/-15.499, 0's: 0 Z-trim(105.5): 63 B-trim: 4 in 1/50 Lambda= 0.146035 statistics sampled from 8420 (8483) to 8420 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.631), E-opt: 0.2 (0.261), width: 16 Scan time: 2.920 The best scores are: opt bits E(32554) CCDS9828.1 ABCD4 gene_id:5826|Hs108|chr14 ( 606) 3990 850.7 0 CCDS749.1 ABCD3 gene_id:5825|Hs108|chr1 ( 659) 731 164.1 5.2e-40 CCDS8734.1 ABCD2 gene_id:225|Hs108|chr12 ( 740) 524 120.5 7.6e-27 CCDS14728.1 ABCD1 gene_id:215|Hs108|chrX ( 745) 522 120.1 1e-26 >>CCDS9828.1 ABCD4 gene_id:5826|Hs108|chr14 (606 aa) initn: 3990 init1: 3990 opt: 3990 Z-score: 4543.1 bits: 850.7 E(32554): 0 Smith-Waterman score: 3990; 99.7% identity (100.0% similar) in 606 aa overlap (1-606:1-606) 10 20 30 40 50 60 pF1KE6 MAVAGPAPGAGARPRLDLQFLQRFLQILKVLFPSWSSQNALMFLTLLCLTLLEQFVIYQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 MAVAGPAPGAGARPRLDLQFLQRFLQILKVLFPSWSSQNALMFLTLLCLTLLEQFVIYQV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 GLIPSQYYGVLGNKDLEGFKTLTFLAVMLIVLNSTLKSFDQFTCNLLYVSWRKDLTEHLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 GLIPSQYYGVLGNKDLEGFKTLTFLAVMLIVLNSTLKSFDQFTCNLLYVSWRKDLTEHLH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 RLYFRGRAYYTLNVLRDDIDNPDQRISQDVERFCRQLSSMASKLIISPFTLVYYTYQCFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 RLYFRGRAYYTLNVLRDDIDNPDQRISQDVERFCRQLSSMASKLIISPFTLVYYTYQCFQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 STGWLGPVSIFGYFILGTVVNKTLMGPIVMKLVHQEKLEGDFRFKHMQIRVNAEPAAFYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 STGWLGPVSIFGYFILGTVVNKTLMGPIVMKLVHQEKLEGDFRFKHMQIRVNAEPAAFYR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 AGHVEHMRTDRRLQRLLQTQRELMSKELWLYIGINTFDYLGSILSYVVIAIPIFSGVYGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 AGHVEHMRTDRRLQRLLQTQRELMSKELWLYIGINTFDYLGSILSYVVIAIPIFSGVYGD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 LSPTELSTLVSKNAFVCIYLISCFTQLIDLSTTLSDVAGYTHRIGQLRETLLDMSLKSQD :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 LSPAELSTLVSKNAFVCIYLISCFTQLIDLSTTLSDVAGYTHRIGQLRETLLDMSLKSQD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 CEILGESKWGLDTPPGWPAAEPADTAFLLERVSISAPSSDKPLIKDLSLKISEGQSLLIT :::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 CEILGESEWGLDTPPGWPAAEPADTAFLLERVSISAPSSDKPLIKDLSLKISEGQSLLIT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 GNTGTGKTSLLRVLGGLWTSTRGSVQMLTDFGPHGVLFLPQKPFFTDGTLREQVIYPLKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 GNTGTGKTSLLRVLGGLWTSTRGSVQMLTDFGPHGVLFLPQKPFFTDGTLREQVIYPLKE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 VYPDSGSADDERILRFLELAGLSNLVARTEGLDQQVDWNWYDVLSPGEMQRLSFARLFYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 VYPDSGSADDERILRFLELAGLSNLVARTEGLDQQVDWNWYDVLSPGEMQRLSFARLFYL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 QPKYAVLDEATSALTEEVESELYRIGQQLGMTFISVGHRQSLEKFHSLVLKLCGGGRWEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS98 QPKYAVLDEATSALTEEVESELYRIGQQLGMTFISVGHRQSLEKFHSLVLKLCGGGRWEL 550 560 570 580 590 600 pF1KE6 MRIKVE :::::: CCDS98 MRIKVE >>CCDS749.1 ABCD3 gene_id:5825|Hs108|chr1 (659 aa) initn: 724 init1: 253 opt: 731 Z-score: 831.8 bits: 164.1 E(32554): 5.2e-40 Smith-Waterman score: 898; 29.7% identity (64.0% similar) in 617 aa overlap (9-603:52-650) 10 20 30 pF1KE6 MAVAGPAPGAGARPRLDLQFLQRFLQILKVLFP-SWSS : : .: :..:..::::.. : .. . CCDS74 LLCLLHKRRRALGLHGKKSGKPPLQNNEKEGKKERAVVDKVFFSRLIQILKIMVPRTFCK 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE6 QNALMFLTLLCL---TLLEQFVIYQVGLIPSQYYGVLGN--KDLEGFKTLTFLAVMLIVL ... . : . : : . ..: . :: : :..: ::.. . :.:.:.: .. CCDS74 ETGYLVLIAVMLVSRTYCDVWMIQNGTLIES---GIIGRSRKDFKRY-LLNFIAAMPLI- 90 100 110 120 130 100 110 120 130 140 150 pF1KE6 NSTLKSFDQFTCNLLYVSWRKDLTEHLHRLYFRGRAYYTLNVLRDDIDNPDQRISQDVER : ...: .. : : . .: ::..:.. :... .:: .. : . : :::: ..::::. CCDS74 -SLVNNFLKYGLNELKLCFRVRLTKYLYEEYLQAFTYYKMGNLDNRIANPDQLLTQDVEK 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE6 FCRQLSSMASKLIISPFT-LVYYTYQCFQSTGWLGPVSIFGYFILGTVVNKTLMGPIVMK :: .. .. :.: .:: .: : .. .. : ::.:...:.... . : :: CCDS74 FCNSVVDLYSNLS-KPFLDIVLYIFKLTSAIGAQGPASMMAYLVVSGLFLTRLRRPIGKM 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE6 LVHQEKLEGDFRFKHMQIRVNAEPAAFYRAGHVEHMRTDRRLQRLLQTQRELMSKELWL- . ..: ::..:. . .. .:.: ::: ... :.. . ...:.. .... .. . CCDS74 TITEQKYEGEYRYVNSRLITNSEEIAFYNGNKREKQTVHSVFRKLVEHLHNFILFRFSMG 260 270 280 290 300 310 280 290 300 310 320 pF1KE6 YIGINTFDYLGSILSYVVIAIPIFSGVYGDLS-PTELSTLVS-------KNAFVCIYLIS .: ::.....:.:.. :.. ::: : .:.. : ... . . . . CCDS74 FIDSIIAKYLATVVGYLVVSRPFL-----DLSHPRHLKSTHSELLEDYYQSGRMLLRMSQ 320 330 340 350 360 330 340 350 360 370 pF1KE6 CFTQLIDLSTTLSDVAGYTHRIGQLRETLLDMSLKSQDCEILGESKWGLD----TP--PG . ... . .. .::.: :: .: ..: :.. . . ...... :.. : :: CCDS74 ALGRIVLAGREMTRLAGFTARITELMQVLKDLNHGKYERTMVSQQEKGIEGVQVIPLIPG 370 380 390 400 410 420 380 390 400 410 420 430 pF1KE6 WPAAEPADTAFLLERVSISAPSSDKPLIKDLSLKISEGQSLLITGNTGTGKTSLLRVLGG ::. . ...: ...:..: ::.::.... : ..:: : .: ::.::.:::: CCDS74 AGEIIIADNIIKFDHVPLATPNGDV-LIRDLNFEVRSGANVLICGPNGCGKSSLFRVLGE 430 440 450 460 470 480 440 450 460 470 480 490 pF1KE6 LWTSTRGSVQMLTDFGPHGVLFLPQKPFFTDGTLREQVIYPLKEVYPDSGSADDERILRF :: : :: ....::.:..: ::::.::::: . . .: . .. CCDS74 LWPLFGGR---LTKPERGKLFYVPQRPYMTLGTLRDQVIYPDGREDQKRKGISDLVLKEY 490 500 510 520 530 540 500 510 520 530 540 550 pF1KE6 LELAGLSNLVARTEGLDQQVDWNWYDVLSPGEMQRLSFARLFYLQPKYAVLDEATSALTE :. . :.... : : :. :: .:::: :: ::...::::: .:..:.::: :::.. CCDS74 LDNVQLGHILEREGGWDSVQDW--MDVLSGGEKQRMAMARLFYHKPQFAILDECTSAVSV 550 560 570 580 590 600 560 570 580 590 600 pF1KE6 EVESELYRIGQQLGMTFISVGHRQSLEKFHSLVLKLCGGGRWELMRIKVE .::. .: ...:.:...:.::.:: : : :.. : : .:. .: CCDS74 DVEGYIYSHCRKVGITLFTVSHRKSLWKHHEYYLHMDGRGNYEFKQITEDTVEFGS 610 620 630 640 650 >>CCDS8734.1 ABCD2 gene_id:225|Hs108|chr12 (740 aa) initn: 694 init1: 256 opt: 524 Z-score: 595.4 bits: 120.5 E(32554): 7.6e-27 Smith-Waterman score: 813; 29.4% identity (62.4% similar) in 633 aa overlap (6-603:76-688) 10 20 30 pF1KE6 MAVAGPAPGAGARPRLDLQFLQRFLQILKVLFPSW :.::..: .:....:.. :.:::. CCDS87 QSGHGKKKAAAYPAAENTEILHCTETICEKPSPGVNA------DFFKQLLELRKILFPKL 50 60 70 80 90 40 50 60 70 80 90 pF1KE6 -SSQNALMFLTLLCLTLLEQFVIYQVGLIPSQYYGVLGNKD----LEGFKTLTFLAVMLI ..... . : . : . :: .:: . ... .: .. .: : ..:. CCDS87 VTTETGWLCLHSVALISRTFLSIYVAGLDGKIVKSIVEKKPRTFIIKLIKWL-MIAIPAT 100 110 120 130 140 150 100 110 120 130 140 150 pF1KE6 VLNSTLKSFDQFTCNLLYVSWRKDLTEHLHRLYFRGRAYYTLNVLRDDIDNPDQRISQDV .::... .. :.: ...: :..: .. :: ...:: . . . :::: ...:. CCDS87 FVNSAIRYLE---CKLA-LAFRTRLVDHAYETYFTNQTYYKVINMDGRLANPDQSLTEDI 160 170 180 190 200 210 160 170 180 190 200 pF1KE6 ERFCRQLSSMASKL---IISPFTLVYYTYQCFQSTGW--LGPVSIFGYFILGTVVNKTLM : .... . :.: :.. . : : : : .::. . : . .:. CCDS87 MMFSQSVAHLYSNLTKPILDVMLTSYTLIQTATSRGASPIGPTLLAGLVVYATAKVLKAC 220 230 240 250 260 270 210 220 230 240 250 260 pF1KE6 GPIVMKLVHQE-KLEGDFRFKHMQIRVNAEPAAFYRAGHVEHMRTDRRLQRLLQTQREL- .: ::: .: . .: .:. : .: .:.: :::: :: .:. .. . : : .: CCDS87 SPKFGKLVAEEAHRKGYLRYVHSRIIANVEEIAFYR-GHKVEMKQLQKSYKALADQMNLI 280 290 300 310 320 330 270 280 290 300 310 pF1KE6 MSKELWLYIGINTF--DYLGSILSYVVIAIPIFSGV-YGDLSPTELSTLVSK--NAFVCI .::.:: :: :. : :. : . ...::::.... ..: . ...::. .::. CCDS87 LSKRLW-YIMIEQFLMKYVWSSSGLIMVAIPIITATGFADGEDGQKQVMVSERTEAFTTA 340 350 360 370 380 390 320 330 340 350 360 pF1KE6 Y-LISCFTQLID--LST--TLSDVAGYTHRI-------GQLRETLLDMSLKSQDCEILGE :.. .. :. .:. ....:::: :. .... . . :. : .. CCDS87 RNLLASGADAIERIMSSYKEVTELAGYTARVYNMFWVFDEVKRGIYKRTAVIQESESHSK 400 410 420 430 440 450 370 380 390 400 410 420 pF1KE6 SKWGLDTPPGWPAAEPA-----DTAFLLERVSISAPSSDKPLIKDLSLKISEGQSLLITG . .. : . : . : ... : : : .:... . . :..:. ::. ::::: CCDS87 NGAKVELPLSDTLAIKGKVIDVDHGIICENVPIITPAGEV-VASRLNFKVEEGMHLLITG 460 470 480 490 500 510 430 440 450 460 470 480 pF1KE6 NTGTGKTSLLRVLGGLWTSTRGSVQMLTDFGPHGVLFLPQKPFFTDGTLREQVIYPLK-E .: ::.::.:.:.::: .: .: :. ....::.:... :.::.::::: . . CCDS87 PNGCGKSSLFRILSGLWPVYEG---VLYKPPPQHMFYIPQRPYMSLGSLRDQVIYPDSVD 520 530 540 550 560 490 500 510 520 530 540 pF1KE6 VYPDSGSADDERILRFLELAGLSNLVARTEGLDQQVDWNWYDVLSPGEMQRLSFARLFYL . :.: .:.. . :.:. . : ..: : : : .::. :::: :: ::...::.:: CCDS87 DMHDKGYTDQD-LERILHNVHLYHIVQREGGWDAVMDWK--DVLSGGEKQRMGMARMFYH 570 580 590 600 610 620 550 560 570 580 590 600 pF1KE6 QPKYAVLDEATSALTEEVESELYRIGQQLGMTFISVGHRQSLEKFHSLVLKLCGGGRWEL .::::.::: :::.. .::..... .. :....:. :: :: :.:. .:.. : : :.. CCDS87 KPKYALLDECTSAVSIDVEGKIFQAAKGAGISLLSITHRPSLWKYHTHLLQFDGEGGWRF 630 640 650 660 670 680 pF1KE6 MRIKVE .. CCDS87 EQLDTAIRLTLSEEKQKLESQLAGIPKMQQRLNELCKILGEDSVLKTIKNEDETS 690 700 710 720 730 740 >>CCDS14728.1 ABCD1 gene_id:215|Hs108|chrX (745 aa) initn: 754 init1: 257 opt: 522 Z-score: 593.1 bits: 120.1 E(32554): 1e-26 Smith-Waterman score: 796; 28.9% identity (61.6% similar) in 640 aa overlap (10-603:61-684) 10 20 30 pF1KE6 MAVAGPAPGAGARPRLDLQFLQRFLQILKVLFPSWSSQN :.:. .. ::::.: .:..::: .. CCDS14 KVYPLVRQCLAPARGLQAPAGEPTQEASGVAAAKAGMNRVFLQRLLWLLRLLFPRVLCRE 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE6 ALMFLTLLCLTLLEQ-FVIYQVGLIPSQYYGVLGNKDLEGFKTLTFLAVMLIVLNSTL-K . . :.: .:. . :. :. . .. . :: ..: .: .::.: .:. . CCDS14 TGL-LALHSAALVSRTFLSVYVARLDGRLARCIVRKDPRAFG-WQLLQWLLIALPATFVN 100 110 120 130 140 100 110 120 130 140 150 pF1KE6 SFDQFTCNLLYVSWRKDLTEHLHRLYFRGRAYYTLNVLRDDIDNPDQRISQDVERFCRQL : .. . : .:.:. :. : .:::: ..:: .. . . :::: ...:: : .. CCDS14 SAIRYLEGQLALSFRSRLVAHAYRLYFSQQTYYRVSNMDGRLRNPDQSLTEDVVAFAASV 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE6 SSMASKLI-------ISPFTLVYYTYQCFQSTGWLGPVSIFGYFILGTVVNKTLMGPIVM . . :.: .. .::. . . .:.: : .: : .. :. ..: CCDS14 AHLYSNLTKPLLDVAVTSYTLLRAARSRGAGTAW--PSAIAGLVVFLTANVLRAFSPKFG 210 220 230 240 250 260 220 230 240 250 260 pF1KE6 KLVHQE-KLEGDFRFKHMQIRVNAEPAAFYRAGHVEHMRTDRRLQRLLQTQRELMSKELW .:: .: . .:..:. : .. .:.: ::: . .:: .: : : . .. ..:: CCDS14 ELVAEEARRKGELRYMHSRVVANSEEIAFYGGHEVELALLQRSYQDLASQINLILLERLW 270 280 290 300 310 320 270 280 290 300 310 pF1KE6 LYIGINTF--DYLGSILSYVVIAIPIFSGVYGDLSPTEL----------STLVSK--NAF :. .. : :. : . ...:.::.... . : .: :::. .:: CCDS14 -YVMLEQFLMKYVWSASGLLMVAVPIITATGYSESDAEAVKKAALEKKEEELVSERTEAF 330 340 350 360 370 380 320 330 340 350 360 pF1KE6 -VCIYLISCFTQLID--LST--TLSDVAGYTHRIGQLRETLLDMSLKSQDCEI-----LG . :.. .. :. .:. ....:::: :. .. ... :. : :.. : CCDS14 TIARNLLTAAADAIERIMSSYKEVTELAGYTARVHEMFQVFEDV----QRCHFKRPRELE 390 400 410 420 430 440 370 380 390 400 410 pF1KE6 ESKWGLDTP--PGWPAAEP---------ADTAFLLERVSISAPSSDKPLIKDLSLKISEG ... : : : . : .. ... : . : .::.. .. .:.... :: CCDS14 DAQAGSGTIGRSGVRVEGPLKIRGQVVDVEQGIICENIPIVTPSGEV-VVASLNIRVEEG 450 460 470 480 490 500 420 430 440 450 460 470 pF1KE6 QSLLITGNTGTGKTSLLRVLGGLWTSTRGSVQMLTDFGPHGVLFLPQKPFFTDGTLREQV . ::::: .: ::.::.:.::::: : :.: : :. ....::.:... :.::.:: CCDS14 MHLLITGPNGCGKSSLFRILGGLWP-TYGGV--LYKPPPQRMFYIPQRPYMSVGSLRDQV 510 520 530 540 550 480 490 500 510 520 530 pF1KE6 IYPLK-EVYPDSGSADDERILRFLELAGLSNLVARTEGLDQQVDWNWYDVLSPGEMQRLS ::: . : . .: .... . .:... : ... : : . . ::. :::: :: ::.. CCDS14 IYPDSVEDMQRKGYSEQD-LEAILDVVHLHHILQREGGWEAMCDWK--DVLSGGEKQRIG 560 570 580 590 600 610 540 550 560 570 580 590 pF1KE6 FARLFYLQPKYAVLDEATSALTEEVESELYRIGQQLGMTFISVGHRQSLEKFHSLVLKLC .::.:: .::::.::: :::.. .::..... ... :....:. :: :: :.:. .:.. CCDS14 MARMFYHRPKYALLDECTSAVSIDVEGKIFQAAKDAGIALLSITHRPSLWKYHTHLLQFD 620 630 640 650 660 670 600 pF1KE6 GGGRWELMRIKVE : : :.. .. CCDS14 GEGGWKFEKLDSAARLSLTEEKQRLEQQLAGIPKMQRRLQELCQILGEAVAPAHVPAPSP 680 690 700 710 720 730 606 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:57:18 2016 done: Tue Nov 8 12:57:19 2016 Total Scan time: 2.920 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]