FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3294, 766 aa 1>>>pF1KE3294 766 - 766 aa - 766 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9782+/-0.00111; mu= 16.0592+/- 0.066 mean_var=66.9478+/-13.284, 0's: 0 Z-trim(102.0): 46 B-trim: 2 in 1/50 Lambda= 0.156750 statistics sampled from 6731 (6755) to 6731 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.552), E-opt: 0.2 (0.208), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS6910.1 ZER1 gene_id:10444|Hs108|chr9 ( 766) 5079 1158.2 0 CCDS30717.1 ZYG11B gene_id:79699|Hs108|chr1 ( 744) 816 194.2 6.5e-49 CCDS44148.1 ZYG11A gene_id:440590|Hs108|chr1 ( 759) 639 154.2 7.4e-37 CCDS76166.1 ZYG11A gene_id:440590|Hs108|chr1 ( 417) 595 144.2 4.2e-34 >>CCDS6910.1 ZER1 gene_id:10444|Hs108|chr9 (766 aa) initn: 5079 init1: 5079 opt: 5079 Z-score: 6201.5 bits: 1158.2 E(32554): 0 Smith-Waterman score: 5079; 100.0% identity (100.0% similar) in 766 aa overlap (1-766:1-766) 10 20 30 40 50 60 pF1KE3 MASDTPESLMALCTDFCLRNLDGTLGYLLDKETLRLHPDIFLPSEICDRLVNEYVELVNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 MASDTPESLMALCTDFCLRNLDGTLGYLLDKETLRLHPDIFLPSEICDRLVNEYVELVNA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 ACNFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDLEAIRKQDLVELYLTNCEKLSAKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 ACNFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDLEAIRKQDLVELYLTNCEKLSAKS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 LQTLRSFSHTLVSLSLFGCTNIFYEEENPGGCEDEYLVNPTCQVLVKDFTFEGFSRLRFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 LQTLRSFSHTLVSLSLFGCTNIFYEEENPGGCEDEYLVNPTCQVLVKDFTFEGFSRLRFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 NLGRMIDWVPVESLLRPLNSLAALDLSGIQTSDAAFLTQWKDSLVSLVLYNMDLSDDHIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 NLGRMIDWVPVESLLRPLNSLAALDLSGIQTSDAAFLTQWKDSLVSLVLYNMDLSDDHIR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 VIVQLHKLRHLDISRDRLSSYYKFKLTREVLSLFVQKLGNLMSLDISGHMILENCSISKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 VIVQLHKLRHLDISRDRLSSYYKFKLTREVLSLFVQKLGNLMSLDISGHMILENCSISKM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 EEEAGQTSIEPSKSSIIPFRALKRPLQFLGLFENSLCRLTHIPAYKVSGDKNEEQVLNAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 EEEAGQTSIEPSKSSIIPFRALKRPLQFLGLFENSLCRLTHIPAYKVSGDKNEEQVLNAI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 EAYTEHRPEITSRAINLLFDIARIERCNQLLRALKLVITALKCHKYDRNIQVTGSAALFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 EAYTEHRPEITSRAINLLFDIARIERCNQLLRALKLVITALKCHKYDRNIQVTGSAALFY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 LTNSEYRSEQSVKLRRQVIQVVLNGMESYQEVTVQRNCCLTLCNFSIPEELEFQYRRVNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 LTNSEYRSEQSVKLRRQVIQVVLNGMESYQEVTVQRNCCLTLCNFSIPEELEFQYRRVNE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 LLLSILNPTRQDESIQRIAVHLCNALVCQVDNDHKEAVGKMGFVVTMLKLIQKKLLDKTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 LLLSILNPTRQDESIQRIAVHLCNALVCQVDNDHKEAVGKMGFVVTMLKLIQKKLLDKTC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 DQVMEFSWSALWNITDETPDNCEMFLNFNGMKLFLDCLKEFPEKQELHRNMLGLLGNVAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 DQVMEFSWSALWNITDETPDNCEMFLNFNGMKLFLDCLKEFPEKQELHRNMLGLLGNVAE 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 VKELRPQLMTSQFISVFSNLLESKADGIEVSYNACGVLSHIMFDGPEAWGVCEPQREEVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 VKELRPQLMTSQFISVFSNLLESKADGIEVSYNACGVLSHIMFDGPEAWGVCEPQREEVE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 ERMWAAIQSWDINSRRNINYRSFEPILRLLPQGISPVSQHWATWALYNLVSVYPDKYCPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS69 ERMWAAIQSWDINSRRNINYRSFEPILRLLPQGISPVSQHWATWALYNLVSVYPDKYCPL 670 680 690 700 710 720 730 740 750 760 pF1KE3 LIKEGGMPLLRDIIKMATARQETKEMARKVIEHCSNFKEENMDTSR :::::::::::::::::::::::::::::::::::::::::::::: CCDS69 LIKEGGMPLLRDIIKMATARQETKEMARKVIEHCSNFKEENMDTSR 730 740 750 760 >>CCDS30717.1 ZYG11B gene_id:79699|Hs108|chr1 (744 aa) initn: 732 init1: 269 opt: 816 Z-score: 991.6 bits: 194.2 E(32554): 6.5e-49 Smith-Waterman score: 931; 28.4% identity (60.2% similar) in 772 aa overlap (1-752:10-720) 10 20 30 40 50 pF1KE3 MASDTPESLMALCTDFCLRNLDGTLGYLLDKETLRLHPDIFLPSEICDRLV : .: ::. .: .: .:. . : .: .: :.:. ::: CCDS30 MPEDQAGAAMEEASPYSLLDICLNFLTTHLEKFCSARQDGTLCLQEPGVF-PQEVADRL- 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 NEYVELVNAACNFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDL-EAIRKQDLVELYL : . : . ... ..: . :: : .:. .. . .:. .. :::: CCDS30 -----LRTMAFHGLLNDGTVGIFRG-NQMRLKRACIRKAKISAVAFRKAFCHHKLVELDA 60 70 80 90 100 110 120 130 140 150 160 pF1KE3 T--NCEKLSAKSLQTLRSFSHTLVSLSLFGCTNIFYEEENPGGCEDEYLVNPTCQVLVKD : : . . .. : : . .:. . ... :.: : CCDS30 TGVNADITITDIISGLGSNKWIQQNLQCLVLNSLTLSLEDP---------YERC------ 120 130 140 150 170 180 190 200 210 220 pF1KE3 FTFEGFSRLRFLNLGRMI----DWVPVESLLRPLNSLAALDLSGIQTSDAAFLTQWKDSL : .: :: :.. .. : . : :: : : .::.:. . .: . : :: : CCDS30 --FSRLSGLRALSITNVLFYNEDLAEVASLPR----LESLDISNTSITDITALLACKDRL 160 170 180 190 200 210 230 240 250 260 270 pF1KE3 VSLVLYNMD---LSDDHI-RVIVQLHKLRHLDISRDRLSSYYKFKLTREV-LSLFVQK-- ::..... .. .: :. .:..: ::::: :. ..: .. : :. :: CCDS30 KSLTMHHLKCLKMTTTQILDVVRELKHLNHLDISDDK-------QFTSDIALRLLEQKDI 220 230 240 250 260 280 290 300 310 320 330 pF1KE3 LGNLMSLDISGHMILENCSISKMEEEAGQTSIEPSKSSIIPFRALKRP-LQFLGLFENSL : ::.:::.::. ... ..: .. :. .:: .::.::. .. CCDS30 LPNLVSLDVSGR--------KHVTDKAVEAFIQ------------QRPSMQFVGLLATDA 270 280 290 300 340 350 360 370 380 390 pF1KE3 CR---LTHIPAYKVSGDKNEEQVLNAIEAYTEHRPEITSRAINLLFDIARIERCNQLLRA :: ::::. :: :. .:.. :.: : .. .:. ::..... . .. . CCDS30 GYSEFLTGEGHLKVSGEANETQIAEALKRYSE-RAFFVREALFHLFSLTHVMEKTKP-EI 310 320 330 340 350 360 400 410 420 430 440 450 pF1KE3 LKLVITALKCHKYDRNIQVTGSAALFYLTNSEYRSEQSVKLRRQVIQVVLNGMESY-QEV ::::.:... : .. .:...:: .: ::... . . :.: .: ...:..:: . .. CCDS30 LKLVVTGMRNHPMNLPVQLAASACVFNLTKQDLAAGMPVRLLADVTHLLLKAMEHFPNHQ 370 380 390 400 410 420 460 470 480 490 500 510 pF1KE3 TVQRNCCLTLCNFSIPEELEFQYRRVNELLLSILNPTRQDESIQRIAVHLCNALVCQVDN .:.:: :.::. : ... :. .. .:... : ...:...::.:: . . :. .... CCDS30 QLQKNCLLSLCSDRILQDVPFNRFEAAKLVMQWLC-NHEDQNMQRMAVAIISILAAKLST 430 440 450 460 470 480 520 530 540 550 560 570 pF1KE3 DHKEAVGKMGFVVT-MLKLIQKKLLDKTCDQVMEFSWSALWNITDETPDNCEMFLNFNGM .. .: :.: .:.....: ... : ...:. :::::.:::.: .:. :.. .:. CCDS30 EQTAQLGTELFIVRQLLQIVKQKTNQNSVDTTLKFTLSALWNLTDESPTTCRHFIENQGL 490 500 510 520 530 540 580 590 600 610 620 630 pF1KE3 KLFLDCLKEFPEKQELHRNMLGLLGNVAEVKELRPQLMTSQFISVFSNLLESKADGIEVS .::. :. :: .. .....::::.:.:::.::. .:: ..::. .:.::.: .::: CCDS30 ELFMRVLESFPTESSIQQKVLGLLNNIAEVQELHSELMWKDFIDHISSLLHSVE--VEVS 550 560 570 580 590 640 650 660 670 680 690 pF1KE3 YNACGVLSHIMFDGPEAWGVCEPQREEVEERMWAAIQSWDINSRRNINYRSFEPILRLLP : : :...:.. : .:: . . ::. . . . .:: .: . . ::::.:.. :: CCDS30 YFAAGIIAHLISRGEQAWTLSRSQRNSLLDDLHSAILKWPTPECEMVAYRSFNPFFPLLG 600 610 620 630 640 650 700 710 720 730 740 750 pF1KE3 QGISPVSQHWATWALYNLVSVYPDKYCPLLIKEGGMPLLRDIIKMATARQETKEMARKVI .: : ::.::. .. : :..:: .::.:::. : .: . .....: .. CCDS30 CFTTPGVQLWAVWAMQHVCSKNPSRYCSMLIEEGGLQHLYNIKDHEHTDPHVQQIAVAIL 660 670 680 690 700 710 760 pF1KE3 EHCSNFKEENMDTSR . CCDS30 DSLEKHIVRHGRPPPCKKQPQARLN 720 730 740 >>CCDS44148.1 ZYG11A gene_id:440590|Hs108|chr1 (759 aa) initn: 372 init1: 190 opt: 639 Z-score: 775.1 bits: 154.2 E(32554): 7.4e-37 Smith-Waterman score: 735; 26.7% identity (59.0% similar) in 719 aa overlap (74-766:70-751) 50 60 70 80 90 100 pF1KE3 SEICDRLVNEYVELVNAACNFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDLEAIRKQ : . . :. :. . . :. .: . CCDS44 NICLNVLIANLEKLCSERPDGTLCLPEHWSFPQEVAERFLRVMTWQGKLTDRTASIFRGN 40 50 60 70 80 90 110 120 130 140 150 160 pF1KE3 DLVELYLTNCEKLSAKSLQTLRSFS-HTLVSLSLFGC-TNIFYEEENPGGCEDEYLVNPT .. .: :.: .: . .. ...: : :. :. . ... . : : ... .. . CCDS44 QM-KLKLVNIQKAKISTAAFIKAFCRHKLIELNATAVHADLPVPDIISGLCSNRW-IQQN 100 110 120 130 140 150 170 180 190 200 210 pF1KE3 CQVLVKDFT-FEGFSRLRFLN--LG-RMIDWVPV----ESL--LRPLNSLAALDLSGIQT : :. : : . ::: :.. : :... : :.: . : : .::.:. . CCDS44 LQCLLLDSTSIPQNSRLLFFSQLTGLRILSVFNVCFHTEDLANVSQLPRLESLDISNTLV 160 170 180 190 200 210 220 230 240 250 260 pF1KE3 SDAAFLTQWKDSLVSLVLYNMD---LSDDHIRVIV-QLHKLRHLDISRDR-LSSYYKFKL .: . : :: : ::... . .. ..: ... .:. : ::::: : :.: :.: CCDS44 TDISALLTCKDRLKSLTMHYLKCLAMTKSQILAVIRELKCLLHLDISDHRQLKSDLAFHL 220 230 240 250 260 270 270 280 290 300 310 320 pF1KE3 TREVLSLFVQKLGNLMSLDISGHMILENCSISKMEEEAGQTSIEPSKSSIIPFRALKRPL .. . : :..:::::: :: . .:: . :. :. . CCDS44 LQQK-----DILPNVVSLDISGG----NC----ITDEAVELFIR-----------LRPAM 280 290 300 310 330 340 350 360 370 380 pF1KE3 QFLGLFEN---SLCRLTHIPAYKVSGDKNEEQVLNAIEAYTEHRPEITSRAINLLF-DIA ::.::. . : .: . .:.: . :. .:. : ..: ....:.. :: . CCDS44 QFVGLLATDAGSSDFFTTKQGLRVAGGASMSQISEALSRY-RNRSCFVKEALHRLFTETF 320 330 340 350 360 370 390 400 410 420 430 440 pF1KE3 RIERCNQLLRALKLVITALKCHKYDRNIQVTGSAALFYLTNSEYRSEQSVKLRRQVIQVV .: . :::: ... : : .: :.:: . :: . . . :.: .: .. CCDS44 SMEVTMPAI--LKLVAIGMRNHPLDLRVQFTASACALNLTRQGLAKGMPVRLLSEVTCLL 380 390 400 410 420 430 450 460 470 480 490 500 pF1KE3 LNGMESYQEVT-VQRNCCLTLCNFSIPEELEFQYRRVNELLLSILNPTRQDESIQRIAVH ....... . .:.:: :.: : : .. :. . .... : ... ..: .:: CCDS44 FKALKNFPHYQQLQKNCLLSLTNSRILVDVPFDRFDAAKFVMRWLCK-HENPKMQTMAVS 440 450 460 470 480 510 520 530 540 550 560 pF1KE3 LCNALVCQVDNDHKEAVGKMGFVVT-MLKLIQKKLLDKTCDQVMEFSWSALWNITDETPD . . :. :.. .. . .. ..: .: ....: .. : .. :. .::::.:: .: CCDS44 VTSILALQLSPEQTAQLEELFMAVKELLAIVKQKTTENLDDVTFLFTLKALWNLTDGSPA 490 500 510 520 530 540 570 580 590 600 610 620 pF1KE3 NCEMFLNFNGMKLFLDCLKEFPEKQELHRNMLGLLGNVAEVKELRPQLMTSQFISVFSNL :. :.. .:...:.. :. : :. .. ..::::.:.:::.:: .:.: . .. ...: CCDS44 ACKHFIENQGLQIFIQVLETFSESA-IQSKVLGLLNNIAEVRELSSKLVTEDVLKHINSL 550 560 570 580 590 600 630 640 650 660 670 pF1KE3 LESKADGIEVSYNACGVLSHIMFDGPEAWGVCEPQREEVEERMWAAIQSWDINSRRN--- : :. .:::: : :...:. : . : . ::. . . . :.::.: .: . CCDS44 LCSRE--MEVSYFAAGIIAHLTSDR-QLWISRDFQRRTLLQDLHATIQNWPSSSCKMTAL 610 620 630 640 650 660 680 690 700 710 720 730 pF1KE3 INYRSFEPILRLLPQGISPVSQHWATWALYNLVSVYPDKYCPLLIKEGGMPLLRDIIKMA ..::::. .. :: . .: : :: ::.:.. : :.::: .:..: :. :: :: . . CCDS44 VTYRSFKTFFPLLGNFSQPEVQLWALWAMYHVCSKNPSKYCKMLVEEEGLQLLCDIQEHS 670 680 690 700 710 720 740 750 760 pF1KE3 TARQETKEMARKVIEHCSNFKEENMDTSR : .....: .... .:. . :. .: CCDS44 EATPKAQQIAASILD---DFRMHFMNYQRPTLCQMPF 730 740 750 >>CCDS76166.1 ZYG11A gene_id:440590|Hs108|chr1 (417 aa) initn: 411 init1: 190 opt: 595 Z-score: 725.7 bits: 144.2 E(32554): 4.2e-34 Smith-Waterman score: 595; 28.0% identity (63.9% similar) in 418 aa overlap (355-766:3-409) 330 340 350 360 370 380 pF1KE3 PLQFLGLFENSLCRLTHIPAYKVSGDKNEEQVLNAIEAYTEHRPEITSRAINLLF-DIAR :. .:. : ..: ....:.. :: . CCDS76 MSQISEALSRY-RNRSCFVKEALHRLFTETFS 10 20 30 390 400 410 420 430 440 pF1KE3 IERCNQLLRALKLVITALKCHKYDRNIQVTGSAALFYLTNSEYRSEQSVKLRRQVIQVVL .: . :::: ... : : .: :.:: . :: . . . :.: .: ... CCDS76 MEVTMPAI--LKLVAIGMRNHPLDLRVQFTASACALNLTRQGLAKGMPVRLLSEVTCLLF 40 50 60 70 80 450 460 470 480 490 500 pF1KE3 NGMESYQEVT-VQRNCCLTLCNFSIPEELEFQYRRVNELLLSILNPTRQDESIQRIAVHL ...... . .:.:: :.: : : .. :. . .... : ... ..: .:: . CCDS76 KALKNFPHYQQLQKNCLLSLTNSRILVDVPFDRFDAAKFVMRWLCK-HENPKMQTMAVSV 90 100 110 120 130 140 510 520 530 540 550 560 pF1KE3 CNALVCQVDNDHKEAVGKMGFVVT-MLKLIQKKLLDKTCDQVMEFSWSALWNITDETPDN . :. :.. .. . .. ..: .: ....: .. : .. :. .::::.:: .: CCDS76 TSILALQLSPEQTAQLEELFMAVKELLAIVKQKTTENLDDVTFLFTLKALWNLTDGSPAA 150 160 170 180 190 200 570 580 590 600 610 620 pF1KE3 CEMFLNFNGMKLFLDCLKEFPEKQELHRNMLGLLGNVAEVKELRPQLMTSQFISVFSNLL :. :.. .:...:.. :. : :. .. ..::::.:.:::.:: .:.: . .. ...:: CCDS76 CKHFIENQGLQIFIQVLETFSESA-IQSKVLGLLNNIAEVRELSSKLVTEDVLKHINSLL 210 220 230 240 250 260 630 640 650 660 670 pF1KE3 ESKADGIEVSYNACGVLSHIMFDGPEAWGVCEPQREEVEERMWAAIQSWDINSRRN---I :. .:::: : :...:. : . : . ::. . . . :.::.: .: . . CCDS76 CSRE--MEVSYFAAGIIAHLTSDR-QLWISRDFQRRTLLQDLHATIQNWPSSSCKMTALV 270 280 290 300 310 320 680 690 700 710 720 730 pF1KE3 NYRSFEPILRLLPQGISPVSQHWATWALYNLVSVYPDKYCPLLIKEGGMPLLRDIIKMAT .::::. .. :: . .: : :: ::.:.. : :.::: .:..: :. :: :: . . CCDS76 TYRSFKTFFPLLGNFSQPEVQLWALWAMYHVCSKNPSKYCKMLVEEEGLQLLCDIQEHSE 330 340 350 360 370 380 740 750 760 pF1KE3 ARQETKEMARKVIEHCSNFKEENMDTSR : .....: .... .:. . :. .: CCDS76 ATPKAQQIAASILD---DFRMHFMNYQRPTLCQMPF 390 400 410 766 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:08:56 2016 done: Mon Nov 7 18:08:57 2016 Total Scan time: 3.670 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]