FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3070, 227 aa 1>>>pF1KE3070 227 - 227 aa - 227 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2137+/-0.000822; mu= 13.7791+/- 0.049 mean_var=57.3075+/-11.131, 0's: 0 Z-trim(105.4): 22 B-trim: 104 in 1/50 Lambda= 0.169421 statistics sampled from 8411 (8424) to 8411 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.653), E-opt: 0.2 (0.259), width: 16 Scan time: 2.020 The best scores are: opt bits E(32554) CCDS5782.1 FAM3C gene_id:10447|Hs108|chr7 ( 227) 1511 377.5 3.9e-105 CCDS35453.1 FAM3A gene_id:60343|Hs108|chrX ( 230) 834 212.0 2.6e-55 CCDS55542.1 FAM3A gene_id:60343|Hs108|chrX ( 192) 804 204.6 3.5e-53 CCDS76060.1 FAM3A gene_id:60343|Hs108|chrX ( 244) 804 204.7 4.4e-53 CCDS2893.1 FAM3D gene_id:131177|Hs108|chr3 ( 224) 794 202.2 2.2e-52 CCDS13671.1 FAM3B gene_id:54097|Hs108|chr21 ( 235) 501 130.6 8.3e-31 CCDS42930.1 FAM3B gene_id:54097|Hs108|chr21 ( 187) 491 128.1 3.7e-30 CCDS55543.1 FAM3A gene_id:60343|Hs108|chrX ( 213) 440 115.7 2.3e-26 >>CCDS5782.1 FAM3C gene_id:10447|Hs108|chr7 (227 aa) initn: 1511 init1: 1511 opt: 1511 Z-score: 2001.0 bits: 377.5 E(32554): 3.9e-105 Smith-Waterman score: 1511; 100.0% identity (100.0% similar) in 227 aa overlap (1-227:1-227) 10 20 30 40 50 60 pF1KE3 MRVAGAAKLVVAVAVFLLTFYVISQVFEIKMDASLGNLFARSALDTAARSTKPPRYKCGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 MRVAGAAKLVVAVAVFLLTFYVISQVFEIKMDASLGNLFARSALDTAARSTKPPRYKCGI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 SKACPEKHFAFKMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTGEVLDTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 SKACPEKHFAFKMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTGEVLDTK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 YFDMWGGDVAPFIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSITNLGFRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 YFDMWGGDVAPFIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSITNLGFRD 130 140 150 160 170 180 190 200 210 220 pF1KE3 NWVFCGGKGIKTKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD ::::::::::::::::::::::::::::::::::::::::::::::: CCDS57 NWVFCGGKGIKTKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD 190 200 210 220 >>CCDS35453.1 FAM3A gene_id:60343|Hs108|chrX (230 aa) initn: 826 init1: 797 opt: 834 Z-score: 1106.6 bits: 212.0 E(32554): 2.6e-55 Smith-Waterman score: 834; 51.5% identity (82.7% similar) in 231 aa overlap (1-225:1-226) 10 20 30 40 50 pF1KE3 MRVAGAAKLVVAVAVFLLTFYVISQVFEIKMDASLGNLFAR-SALDTAARS--TKPPR-- ::.:: ..:: :. .:. :.: .. .. :. : : . : :. .: : :: CCDS35 MRLAGPLRIVVLVVSVGVTWIVVSILL-----GGPGSGFPRIQQLFTSPESSVTAAPRAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 -YKCGISKACPEKHFAFKMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTG ::::. . :::.:.::...::::::.::::::::..:::.::.:::::.:.::.:: .: CCDS35 KYKCGLPQPCPEEHLAFRVVSGAANVIGPKICLEDKMLMSSVKDNVGRGLNIALVNGVSG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 EVLDTKYFDMWGGDVAPFIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSIT :..... ::::.::: ...:.. ...::.:....::: :::.:.:.:.:...::: . CCDS35 ELIEARAFDMWAGDVNDLLKFIRPLHEGTLVFVASYDDPATKMNEETRKLFSELGSRNAK 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 NLGFRDNWVFCGGKGIKTKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD .:.:::.::: :.::...:::::::.::.: .::::::::..:::::::.. CCDS35 ELAFRDSWVFVGAKGVQNKSPFEQHVKNSKHSNKYEGWPEALEMEGCIPRRSTAS 180 190 200 210 220 230 >>CCDS55542.1 FAM3A gene_id:60343|Hs108|chrX (192 aa) initn: 797 init1: 797 opt: 804 Z-score: 1068.2 bits: 204.6 E(32554): 3.5e-53 Smith-Waterman score: 804; 56.5% identity (89.7% similar) in 184 aa overlap (42-225:8-188) 20 30 40 50 60 70 pF1KE3 AVAVFLLTFYVISQVFEIKMDASLGNLFARSALDTAARSTKPPRYKCGISKACPEKHFAF :.. .: :. : ::::. . :::.:.:: CCDS55 MRLAGPESSVTAAPRARK---YKCGLPQPCPEEHLAF 10 20 30 80 90 100 110 120 130 pF1KE3 KMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTGEVLDTKYFDMWGGDVAP ...::::::.::::::::..:::.::.:::::.:.::.:: .::..... ::::.::: CCDS55 RVVSGAANVIGPKICLEDKMLMSSVKDNVGRGLNIALVNGVSGELIEARAFDMWAGDVND 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE3 FIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSITNLGFRDNWVFCGGKGIK ...:.. ...::.:....::: :::.:.:.:.:...::: . .:.:::.::: :.::.. CCDS55 LLKFIRPLHEGTLVFVASYDDPATKMNEETRKLFSELGSRNAKELAFRDSWVFVGAKGVQ 100 110 120 130 140 150 200 210 220 pF1KE3 TKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD .:::::::.::.: .::::::::..:::::::.. CCDS55 NKSPFEQHVKNSKHSNKYEGWPEALEMEGCIPRRSTAS 160 170 180 190 >>CCDS76060.1 FAM3A gene_id:60343|Hs108|chrX (244 aa) initn: 814 init1: 797 opt: 804 Z-score: 1066.5 bits: 204.7 E(32554): 4.4e-53 Smith-Waterman score: 804; 56.5% identity (89.7% similar) in 184 aa overlap (42-225:60-240) 20 30 40 50 60 70 pF1KE3 AVAVFLLTFYVISQVFEIKMDASLGNLFARSALDTAARSTKPPRYKCGISKACPEKHFAF :.. .: :. : ::::. . :::.:.:: CCDS76 AISVHCNLYLLGSSDSSAPASRVAETTGPESSVTAAPRARK---YKCGLPQPCPEEHLAF 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE3 KMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTGEVLDTKYFDMWGGDVAP ...::::::.::::::::..:::.::.:::::.:.::.:: .::..... ::::.::: CCDS76 RVVSGAANVIGPKICLEDKMLMSSVKDNVGRGLNIALVNGVSGELIEARAFDMWAGDVND 90 100 110 120 130 140 140 150 160 170 180 190 pF1KE3 FIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSITNLGFRDNWVFCGGKGIK ...:.. ...::.:....::: :::.:.:.:.:...::: . .:.:::.::: :.::.. CCDS76 LLKFIRPLHEGTLVFVASYDDPATKMNEETRKLFSELGSRNAKELAFRDSWVFVGAKGVQ 150 160 170 180 190 200 200 210 220 pF1KE3 TKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD .:::::::.::.: .::::::::..:::::::.. CCDS76 NKSPFEQHVKNSKHSNKYEGWPEALEMEGCIPRRSTAS 210 220 230 240 >>CCDS2893.1 FAM3D gene_id:131177|Hs108|chr3 (224 aa) initn: 825 init1: 768 opt: 794 Z-score: 1053.9 bits: 202.2 E(32554): 2.2e-52 Smith-Waterman score: 794; 51.3% identity (77.4% similar) in 226 aa overlap (1-225:1-222) 10 20 30 40 50 pF1KE3 MRVAGAAKLVVAVAVFLLTFYVISQVFEIKMDA-SLGNLFARSALDTAARSTKPPRYKCG :::.:. .:.. . ... :.. : . . ..: . : .: : .. . .:::: CCDS28 MRVSGVLRLLALIFAIVTTWMFIRSYMSFSMKTIRLPRWLAASP----TKEIQVKKYKCG 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 ISKACPEKHFAFKMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTGEVLDT . : :: ..::::. ::::::::: .:.:: ..:: ::::::::.:.::.:: :: :: CCDS28 LIKPCPANYFAFKICSGAANVVGPTMCFEDRMIMSPVKNNVGRGLNIALVNGTTGAVLGQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 KYFDMWGGDVAPFIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSITNLGFR : :::..::: ...::: : :..::...::: .::.:::.:.:..::::. .:::: CCDS28 KAFDMYSGDVMHLVKFLKEIPGGALVLVASYDDPGTKMNDESRKLFSDLGSSYAKQLGFR 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 DNWVFCGGKGIKTKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD :.::: :.: .. :::::: .::. ::::::::::..:::::.: : CCDS28 DSWVFIGAKDLRGKSPFEQFLKNSPDTNKYEGWPELLEMEGCMPPKPF 180 190 200 210 220 >>CCDS13671.1 FAM3B gene_id:54097|Hs108|chr21 (235 aa) initn: 437 init1: 221 opt: 501 Z-score: 666.5 bits: 130.6 E(32554): 8.3e-31 Smith-Waterman score: 501; 36.8% identity (65.8% similar) in 228 aa overlap (5-226:7-234) 10 20 30 40 50 pF1KE3 MRVAGAAKLVVAVAVFLLTFYVISQVFEIKMDASLGN--LFARSALDTAA-RSTKPPR : :.: .: . : ..: . :. :: :.. :: . . .. : : CCDS13 MRPLAGGLLKVVFVVFASLCAWYSGYLLAELIPDAPLSSAAYSIRSIGERPVLKAPVPKR 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 YKCGISKACPEKHFAFKMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTGE :: :: .:... ::.. :::.:::.::. .::.::::.:..: ::. CCDS13 QKCDHWTPCPSDTYAYRLLSGGGRSKYAKICFEDNLLMGEQLGNVARGINIAIVNYVTGN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 VLDTKYFDMWGGDVA-PFIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSIT : :. :::. :: . :. .:... ....: :::::.:.::..:. : ::: : CCDS13 VTATRCFDMYEGDNSGPMTKFIQSAAPKSLLFMVTYDDGSTRLNNDAKNAIEALGSKEIR 130 140 150 160 170 180 180 190 200 210 220 pF1KE3 NLGFRDNWVFCGGKGIKTKSPFEQHIKNNKDT--NKYEGWPEVVEMEGCIPQKQD :. ::..::: ..::.. : .... :..:. :.: ::: ...:::::... CCDS13 NMKFRSSWVFIAAKGLELPSEIQREKINHSDAKNNRYSGWPAEIQIEGCIPKERS 190 200 210 220 230 >>CCDS42930.1 FAM3B gene_id:54097|Hs108|chr21 (187 aa) initn: 437 init1: 221 opt: 491 Z-score: 654.9 bits: 128.1 E(32554): 3.7e-30 Smith-Waterman score: 491; 40.7% identity (70.6% similar) in 177 aa overlap (53-226:10-186) 30 40 50 60 70 80 pF1KE3 ISQVFEIKMDASLGNLFARSALDTAARSTKPPRYKCGISKACPEKHFAFKMASGAANVVG : : :: :: .:... ::.. CCDS42 MRPLAGAPVPKRQKCDHWTPCPSDTYAYRLLSGGGRSKY 10 20 30 90 100 110 120 130 140 pF1KE3 PKICLEDNVLMSGVKNNVGRGINVALANGKTGEVLDTKYFDMWGGDVA-PFIEFLKAIQD :::.:::.::. .::.::::.:..: ::.: :. :::. :: . :. .:... CCDS42 AKICFEDNLLMGEQLGNVARGINIAIVNYVTGNVTATRCFDMYEGDNSGPMTKFIQSAAP 40 50 60 70 80 90 150 160 170 180 190 200 pF1KE3 GTIVLMGTYDDGATKLNDEARRLIADLGSTSITNLGFRDNWVFCGGKGIKTKSPFEQHIK ....: :::::.:.::..:. : ::: : :. ::..::: ..::.. : .... CCDS42 KSLLFMVTYDDGSTRLNNDAKNAIEALGSKEIRNMKFRSSWVFIAAKGLELPSEIQREKI 100 110 120 130 140 150 210 220 pF1KE3 NNKDT--NKYEGWPEVVEMEGCIPQKQD :..:. :.: ::: ...:::::... CCDS42 NHSDAKNNRYSGWPAEIQIEGCIPKERS 160 170 180 >>CCDS55543.1 FAM3A gene_id:60343|Hs108|chrX (213 aa) initn: 739 init1: 433 opt: 440 Z-score: 586.6 bits: 115.7 E(32554): 2.3e-26 Smith-Waterman score: 717; 48.1% identity (76.2% similar) in 231 aa overlap (1-225:1-209) 10 20 30 40 50 pF1KE3 MRVAGAAKLVVAVAVFLLTFYVISQVFEIKMDASLGNLFAR-SALDTAARS--TKPPR-- ::.:: ..:: :. .:. :.: .. .. :. : : . : :. .: : :: CCDS55 MRLAGPLRIVVLVVSVGVTWIVVSILL-----GGPGSGFPRIQQLFTSPESSVTAAPRAR 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 -YKCGISKACPEKHFAFKMASGAANVVGPKICLEDNVLMSGVKNNVGRGINVALANGKTG ::::. . :::.:.::...::::::.::::::::..:::.::.:::::.:.::.: CCDS55 KYKCGLPQPCPEEHLAFRVVSGAANVIGPKICLEDKMLMSSVKDNVGRGLNIALVN---- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 EVLDTKYFDMWGGDVAPFIEFLKAIQDGTIVLMGTYDDGATKLNDEARRLIADLGSTSIT :: ...:.. ...::.:....::: :::.:.:.:.:...::: . CCDS55 -------------DVNDLLKFIRPLHEGTLVFVASYDDPATKMNEETRKLFSELGSRNAK 120 130 140 150 180 190 200 210 220 pF1KE3 NLGFRDNWVFCGGKGIKTKSPFEQHIKNNKDTNKYEGWPEVVEMEGCIPQKQD .:.:::.::: :.::...:::::::.::.: .::::::::..:::::::.. CCDS55 ELAFRDSWVFVGAKGVQNKSPFEQHVKNSKHSNKYEGWPEALEMEGCIPRRSTAS 160 170 180 190 200 210 227 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:15:52 2016 done: Mon Nov 7 19:15:52 2016 Total Scan time: 2.020 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]