FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0711, 623 aa 1>>>pF1KA0711 623 - 623 aa - 623 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.1793+/-0.000894; mu= 8.6412+/- 0.054 mean_var=235.1130+/-49.365, 0's: 0 Z-trim(114.9): 71 B-trim: 963 in 2/52 Lambda= 0.083644 statistics sampled from 15372 (15446) to 15372 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.779), E-opt: 0.2 (0.474), width: 16 Scan time: 3.900 The best scores are: opt bits E(32554) CCDS34795.1 KBTBD11 gene_id:9920|Hs108|chr8 ( 623) 4285 530.2 3.2e-150 CCDS14097.2 KLHDC7B gene_id:113730|Hs108|chr22 ( 594) 994 133.0 1.1e-30 CCDS185.2 KLHDC7A gene_id:127707|Hs108|chr1 ( 777) 672 94.3 6.6e-19 >>CCDS34795.1 KBTBD11 gene_id:9920|Hs108|chr8 (623 aa) initn: 4285 init1: 4285 opt: 4285 Z-score: 2810.4 bits: 530.2 E(32554): 3.2e-150 Smith-Waterman score: 4285; 100.0% identity (100.0% similar) in 623 aa overlap (1-623:1-623) 10 20 30 40 50 60 pF1KA0 MEHAVAPCVLYPGTEPGAAGESESEGAASPAQTPCSLGASLCFSSGEESPPQSLASAAEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MEHAVAPCVLYPGTEPGAAGESESEGAASPAQTPCSLGASLCFSSGEESPPQSLASAAEG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 AATSPPSSGGPRVVERQWEAGSAGAASPEELASPEERACPEEPAAPSPEPRVWLEDPASP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AATSPPSSGGPRVVERQWEAGSAGAASPEELASPEERACPEEPAAPSPEPRVWLEDPASP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 EEPGEPAPVPPGFGAVYGEPDLVLEVSGRRLRAHKAVLAARSDYFRARASRDVLRVQGVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 EEPGEPAPVPPGFGAVYGEPDLVLEVSGRRLRAHKAVLAARSDYFRARASRDVLRVQGVS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 LTALRLLLADAYSGRMAGVRPDNVAEVVAGARRLQLPGAAQRATDAVGPQLSLANCYEVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LTALRLLLADAYSGRMAGVRPDNVAEVVAGARRLQLPGAAQRATDAVGPQLSLANCYEVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 SAAKRQRLNELRDAAYCFMSDHYLEVLREPAVFGRLSGAERDLLLRRRLRAGRAHLLAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SAAKRQRLNELRDAAYCFMSDHYLEVLREPAVFGRLSGAERDLLLRRRLRAGRAHLLAAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 LGPAGERAGSRPQSPSGDADARGDAAVYCFHAAAGEWRELTRLPEGAPARGCGLCVLYNY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LGPAGERAGSRPQSPSGDADARGDAAVYCFHAAAGEWRELTRLPEGAPARGCGLCVLYNY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 LFVAGGVAPAGPDGRARPSDQVFCYNPATDSWSAVRPLRQARSQLRLLALDGHLYAVGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LFVAGGVAPAGPDGRARPSDQVFCYNPATDSWSAVRPLRQARSQLRLLALDGHLYAVGGE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 CLLSVERYDPRADRWAPVAPLPRGAFAVAHEATTCHGEIYVSGGSLFYRLLKYDPRRDEW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CLLSVERYDPRADRWAPVAPLPRGAFAVAHEATTCHGEIYVSGGSLFYRLLKYDPRRDEW 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 QECPCSSSRERSADMVALDGFIYRFDLSGSRGEAQAAGPSGVSVSRYHCLAKQWSPCVAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QECPCSSSRERSADMVALDGFIYRFDLSGSRGEAQAAGPSGVSVSRYHCLAKQWSPCVAP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 LRLPGGPTGLQPFRCAALDGAIYCVSRAGTWRFQPAREGEAGGDAGQGGGFEALGAPLDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LRLPGGPTGLQPFRCAALDGAIYCVSRAGTWRFQPAREGEAGGDAGQGGGFEALGAPLDV 550 560 570 580 590 600 610 620 pF1KA0 RGVLIPFALSLPEKPPRGEQGAP ::::::::::::::::::::::: CCDS34 RGVLIPFALSLPEKPPRGEQGAP 610 620 >>CCDS14097.2 KLHDC7B gene_id:113730|Hs108|chr22 (594 aa) initn: 1014 init1: 645 opt: 994 Z-score: 664.4 bits: 133.0 E(32554): 1.1e-30 Smith-Waterman score: 1107; 37.8% identity (61.4% similar) in 601 aa overlap (30-612:19-585) 10 20 30 40 50 pF1KA0 MEHAVAPCVLYPGTEPGAAGESESEGAASPAQTPCS-LGASLCFSSGEESPPQSLASAAE : .: : .: : : .. :.: .... CCDS14 MVLRSHPFPRQDRPQGSVPRAVPGSPVGPSTSTHSEDRHGPSSSVGTVI 10 20 30 40 60 70 80 90 100 110 pF1KA0 GAATSPPSSGGPRVVERQWEAGSAGAASPEELASPEERACPEEPAAPSPEPRVWLEDPAS :..:. .: . :. : . :. ::. : :. . . .: :.. . : . CCDS14 GTGTGGLVEAGGQPQPRSSE--TNGSPSPDP--PPGLRGEGTREKSLDPLPQAAM--PRG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KA0 PEEPGEPAPVPPGFGAVYGEPDLVLEVSGRRLRAHKAVLAARSDYFRARASRDVL-RVQG : .: :: ::: :. . : : :.. . . . : :: : .. : CCDS14 PAQP--PAQRPPG-PAASSSARRSQPVPQLRKRSRCEIAPSSEQEVRPAASGDPQGEAPG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KA0 VSLT------ALRLLLADAYSGRMAGVRPDNVAEVVAGARRLQLPGAAQRATDAVGPQLS . . :: .: . . :: . . :: : :. . . .. :. .:. CCDS14 EGGSPAGRSGALTEKQEEARKLMVFLQRPGGWG-VVEGPRKPSSRALEPATAAALRRRLD 170 180 190 200 210 240 250 260 270 280 290 pF1KA0 LANCYEVLSAAKRQRLNELRDAAYCFMSDHYLEVLREPAVFGRLSGAERDLLLRRRLRAG :..: .::. :... : . .: .:::. :.:: .: .. :::.:.:. .: : : CCDS14 LGSCLDVLAFAQQHGEPGLAQETYALMSDNLLRVLGDPCLYRRLSAADRERILSLRTGRG 220 230 240 250 260 270 300 310 320 330 340 pF1KA0 RAHLLAAALGPA---GERAGSRPQSPSGDADARG-------DAAVYCFHAAAGEWRELTR :: .:.. . :. : :.: :..: :. . : .. :. . :: ::. CCDS14 RA-VLGVLVLPSLYQGGRSGL-PRGPRGEEPPAAAPVSLPLPAHLHVFNPRENTWRPLTQ 280 290 300 310 320 330 350 360 370 380 390 400 pF1KA0 LPEGAPARGCGLCVLYNYLFVAGGVAPAGPDGRARPSDQVFCYNPATDSWSAVRPLRQAR .:: :: ::::::...::::.:::. .: ..: :..:::::: :. :: :::..::: CCDS14 VPEEAPLRGCGLCTMHNYLFLAGGIRGSG--AKAVCSNEVFCYNPLTNIWSQVRPMQQAR 340 350 360 370 380 390 410 420 430 440 450 460 pF1KA0 SQLRLLALDGHLYAVGGECLLSVERYDPRADRWAPVAPLPRGAFAVAHEATTCHGEIYVS .::.:.:::: :::.::::: :.: ::::.: :.: :::: :.: :::::..:.:.:::. CCDS14 AQLKLVALDGLLYAIGGECLYSMECYDPRTDAWTPRAPLPAGTFPVAHEAVACRGDIYVT 400 410 420 430 440 450 470 480 490 500 510 520 pF1KA0 GGSLFYRLLKYDPRRDEWQECPCSSSRERSADMVALDGFIYRFDLSGSRGEAQAAGPSGV :: ::::::.:.: .: :.::: :.:..::.:.::: ::.::::: :: :. CCDS14 GGHLFYRLLRYSPVKDAWDECPYSASHRRSSDIVALGGFLYRFDLL--RG-------VGA 460 470 480 490 500 530 540 550 560 570 580 pF1KA0 SVSRYHCLAKQWSPCVAPLRLPGGPTGLQPFRCAALDGAIYCVSRAGTWRFQPAREGEAG .: ::. .. .:: .: : ::. :. :..:..: ..:::.. : : . : CCDS14 AVMRYNTVTGSWSR-AASLPLPA-PA---PLHCTTLGNTIYCLNPQVTATFTVS-----G 510 520 530 540 550 590 600 610 620 pF1KA0 GDAGQGGGFEALGAPLDVRGVLIPFALSLPEKPPRGEQGAP : : : . : :: ::: :: :.:: CCDS14 GTA-QFQAKELQPFPLGSTGVLSPFILTLPPEDRLQTSL 560 570 580 590 >>CCDS185.2 KLHDC7A gene_id:127707|Hs108|chr1 (777 aa) initn: 1024 init1: 542 opt: 672 Z-score: 452.9 bits: 94.3 E(32554): 6.6e-19 Smith-Waterman score: 994; 36.8% identity (58.2% similar) in 603 aa overlap (15-612:234-768) 10 20 30 40 pF1KA0 MEHAVAPCVLYPGTEPGAAGESESEGAASPAQTPCSLGASLCFS : ..: :. :. . : . ..: :: CCDS18 PPHCHYVAPLQGSSDMNQSWVFTRVIGVSREEAGALEAASDVDLTLHQQEGAPNSSYTFS 210 220 230 240 250 260 50 60 70 80 90 100 pF1KA0 S-GEESPPQSLASAAEGAATSPPSSGGPRVVERQWEAGSAGAASPEELASPEERACPEEP : .. . . . :::. : .: .: . :. : : .:: :. : : : CCDS18 SIARVRMEEHFIQKAEGVE--PRLKG--KVYDYYVESTSQ-AIFQGRLA-PRTAALTEVP 270 280 290 300 310 110 120 130 140 150 160 pF1KA0 AAPSPEPRVWLEDPASPEEPGEPAPVPPGFGAVYGEPDLVLEVSGRRLRAHKAVLAARSD . : : : :: . :. : . . :. : : . ....: CCDS18 S-PRPPPGSLGTGAASGGQAGD----TKGAAERAASPQTGPWPSTRGFSRKESLLQI--- 320 330 340 350 360 170 180 190 200 210 220 pF1KA0 YFRARASRDVLRVQGVSLTALRLLLADAYSGRMAGVRPDNVAEVVAGARRLQLPGAAQRA :. . :. .: : : : : . : .: . :::. ...: CCDS18 ---AENPELQLQPDGFRLPAPPCPDPGALPGLGRSSREPHV-QPVAGTNFFHIP-----L 370 380 390 400 410 420 230 240 250 260 270 280 pF1KA0 TDAVGPQ--LSLANCYEVLSAAKRQRLNELRDAAYCFMSDHYLEVLREPAVFGRLSGAER : : .:: :.:.::::::. :::: :. :..::: ::..::.::: : ..: :::::: CCDS18 TPASAPQVRLDLGNCYEVLTLAKRQNLEALKEAAYKVMSENYLQVLRSPDIYGCLSGAER 430 440 450 460 470 480 290 300 310 320 330 340 pF1KA0 DLLLRRRLRAGRAHLLAAALGPAGERAGSRPQSPSGDADARGDAAVYCFHAAAGEWRELT .:.:.:::: :: .:..: . : . .: . :. :: :. CCDS18 ELILQRRLR-GRQYLVVADVCPKEDSGG-----------------LCCYDDEQDVWRPLA 490 500 510 520 350 360 370 380 390 400 pF1KA0 RLPEGAPARGCGLCVLYNYLFVAGGVAPAGPDGRARPSDQVFCYNPATDSWSAVRPLRQA :.: : .:::..: :.:::::..: :: :. .::..:::::: : :: : :: :: CCDS18 RMPPEAVSRGCAICSLFNYLFVVSGC--QGP-GH-QPSSRVFCYNPLTGIWSEVCPLNQA 530 540 550 560 570 410 420 430 440 450 460 pF1KA0 RSQLRLLALDGHLYAVGGECLLSVERYDPRADRWAPVAPLPRGAFAVAHEATTCHGEIYV : . ::.::::::::.::::: :::::::: ::: . ::: .::.:: ::. ::.: CCDS18 RPHCRLVALDGHLYAIGGECLNSVERYDPRLDRWDFAPPLPSDTFALAHTATVRAKEIFV 580 590 600 610 620 630 470 480 490 500 510 520 pF1KA0 SGGSLFYRLLKYDPRRDEWQECPCSSSRERSADMVALDGFIYRFDLSGSRGEAQAAGPSG .:::: . :.... ....: : ..:..:.:.:::..::.:::::. : : CCDS18 TGGSLRFLLFRFSAQEQRWWAGPTGGSKDRTAEMVAVNGFLYRFDLNRSLG--------- 640 650 660 670 680 530 540 550 560 570 pF1KA0 VSVSRYHCLA--KQWSPCVAPLRLPGGPTGLQPFRCAALDGAIYCVSRAGTWRFQPAREG .. :.: : . : : : : : : . :.::..:. ::::.: .: : . CCDS18 --IAVYRCSASTRLWYEC-ATYRTPY-P---DAFQCAVVDNLIYCVGRRSTLCFL----A 690 700 710 720 730 580 590 600 610 620 pF1KA0 EAGGDAGQGGGFEALGAPLDVRGVLIPFALSLPEKPPRGEQGAP .. . .... :: .:.:.: .:.:: CCDS18 DSVSPRFVPKELRSFPAP---QGTLLPTVLTLPTPDLPQTRV 740 750 760 770 623 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:40:56 2016 done: Tue Nov 8 06:40:56 2016 Total Scan time: 3.900 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]